Author:
Dinata Rozzi Kesuma,Novriando Haried,Hasdyna Novia,Retno Sujacka
Abstract
Proses clustering dengan algoritma K-Means pada dataset yang memiliki banyak atribut akan mempengaruhi besarnya jumlah iterasi. Pada penelitian ini, metode Information Gain digunakan untuk mereduksi atribut dataset. Dataset yang telah direduksi atribut akan dilanjutkan proses clustering dengan K-Means. Dataset yang dianalisis pada penelitian ini adalah data Hepatitis C Virus yang diperoleh dari UCI Machine Learning Repository, dengan 29 atribut dan 1385 jumlah data. Hasil penelitian ini menunjukkan bahwa rata-rata jumlah iterasi yang diperoleh dari 10 kali pengujian dengan menggunakan K-Means konvensional diperoleh rata-rata sebesar 32 iterasi, sedangkan K-Means dengan reduksi atribut diperoleh rata-rata sebesar 27.7 iterasi. Nilai validitas cluster dihitung menggunakan Davies-Bouldin Index (DBI). Nilai DBI pada K-Means konvensional sebesar 2.1972, sedangkan DBI pada K-Means yang telah direduksi 1 atribut sampai 5 atribut diperoleh nilai rata-rata DBI masing-masing sebesar 2.0290, 1.8771, 1.8641, 1.8389, dan 1.8117.
Cited by
4 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献