FEATURE SELECTION WITH GENETIC ALGORITHMS AND ITS EFFECT ON CLASSIFICATION PERFORMANCE IN MEDICAL DATASETS
Affiliation:
1. AFYON KOCATEPE ÜNİVERSİTESİ, AFYON MESLEK YÜKSEKOKULU
Abstract
Günümüzde çok büyük boyuttaki tıbbi veri tabanlarından, klinik karar destek sistemlerinin faydalı bilgiler elde etmesi oldukça zorlaşmıştır. Genetik algoritmalar (GA) yaygın olarak kullanılan bir özellik seçme yöntemidir ve en iyi çözümleri verebilir. Bu çalışmada, çok sayıda karmaşık verilere sahip olan tıbbi verilerden özellik seçimi yapmak ve en uygun özellik alt kümesini oluşturarak sınıflandırma başarısını artırmak için GA içeren bir model önerilmiştir. Önerilen yöntemin performansını değerlendirmek için çalışmada en çok bilinen ve rahatlıkla ulaşılabilen 5 tıbbi veri kümesi ve 7 farklı denetimli sınıflandırma yöntemi kullanılmıştır. Her veri kümesi ile her sınıflandırıcı için ayrı ayrı özellik seçimi ve sınıflandırma uygulamaları yapılmıştır. Bu uygulamalarda elde edilen sonuçlar, önerilen yaklaşımla yapılan sınıflandırmalarda, veri kümesine bağlı olarak, Doğruluk oranında dolayısıyla makine öğrenmesi modeli performansında ortalama %2 ile %21 arasında artış sağlandığını ortaya koymuştur. Ayrıca yapılan çalışmalarda denetimli sınıflandırma algoritmalarından Rastgele Ormanın bütün veri kümelerinde diğer algoritmalardan daha iyi sonuçlar verdiği görülmekte ve tıbbi veri kümelerindeki sınıflandırma başarısı ile öne çıktığı görülmüştür.
Publisher
Muhendislik Bilimleri ve Tasarim Dergisi
Subject
Colloid and Surface Chemistry,Physical and Theoretical Chemistry
Reference31 articles.
1. Aalaei, S., Shahraki, H., Rowhanimanesh, A., Eslami, S., 2016. Feature selection using genetic algorithm for breast cancer diagnosis: experiment on three different datasets. Iranian journal of basic medical sciences, 19(5), 476. 2. Abdollahi, J., Nouri-Moghaddam, B., 2021. Feature selection for medical diagnosis: Evaluation for using a hybrid Stacked-Genetic approach in the diagnosis of heart disease. arXiv preprint arXiv:2103.08175. Booker, L. B., Goldberg, D. E., Holland, J. H., 1989. Classifier systems and genetic algorithms. Artificial intelligence, 40(1-3), 235-282. 3. Tutorials Point, 2016. Artificial Intelligence and Python, www.tutorialspoint.com. 4. Ba-Alwi, F. M., Hintaya. H. M., 2013. Comparative study for analysis the prognostic in hepatitis data: data mining approach. Spinal Cord, 11(12). 5. Chen, C. W., Tsai, Y. H., Chang, F. R., Lin, W. C., 2020. Ensemble feature selection in medical datasets: Combining filter, wrapper, and embedded feature selection results. Expert Systems, 37(5), e12553.
|
|