Abstract
Bencana alam di Indonesia beberapa diantaranya adalah banjir, gempa bumi, erupsi dan lainnya. Dalam menghadapi hal tersebut, pengelompokan jenis bencana menjadi sangat krusial untuk menetapkan langkah dan rencana yang sesuai. Teknologi dapat digunakan untuk memudahkan proses pengelompokan tersebut, salah satunya dengan memanfaatkan teknik text mining. Pengelompokan informasi dilakukan dengan memasukan kebeberapa klaster dengan dasar keterkaitan antar kata menggunakan algoritma K-Means. Dalam penelitian ini, bertujuan untuk menghasilkan sebuah model pengelompokan bencana alam di Indonesia dengan menerapkan algoritma K-Means. Analisa didasari oleh data komentar masyarakat tentang bencana alam di media sosial Twitter. Penggunaan metode text mining dengan aplikasi RStudio berhasil melakukan pengelompokan bencana alam berdasarkan potensi dan jenisnya dari data komentar masyarakat di media sosial twitter. Setelah melakukan text cleaning, text processing, dan metode TF-IDF, diketahui bahwa banjir dan gempa merupakan topik bencana alam tertinggi dari penambangan data tersebut. Metode unsupervised dengan algoritma K-Means digunakan untuk membangun kelompok topik berdasarkan jarak keterkaitan antar kata-kata. Evaluasi dilakukan menggunakan metode Sum of Square Error dan Silhoutte Coefficient, dan diperoleh akurasi sebesar 75.0% dan 96.7%. Simpulan bahwa algoritma K-Means berhasil membangun kelompok topik berdasarkan jarak keterkaitan antar kata-kata pada data komentar masyarakat tentang bencana alam di twitter.