Abstract
Salgın hastalıklar son yıllarda sıklıkla görülmektedir. Günümüzde gelişmiş veritabanı sistemleri sayesinde vatandaşların klinik ve demografik verilerine ulaşmak mümkündür. Bu veriler yardımıyla makine öğrenme algoritmaları, salgın yayılmaya başlamadan önce risk grubundaki hastaların hastalığın ne kadar şiddetli (evde, hastanede veya yoğun bakım ünitesinde) yaşayacağını tahmin edebilir. Bu tahminler ile gerekli önlemler alınabilir. Bu çalışmada, COVID-19 salgını sırasında İtalya ulusal ilaç veri tabanından elde edilen veriler kullanılmıştır. COVID-19 şiddeti ve şiddeti etkileyen özellikler (Yaş, Diyabet, Hipertansiyon vb.), veri madenciliği (CRISP-DM Metodu), makine öğrenmesi yaklaşımları (Bagged Trees, XGBoost, Random Forest, SVM) ve dengesiz sınıf problemini çözen bir algoritma (SMOTE) kullanılarak tahmin edilmiştir. Deneysel bulgulara göre Torbalı Sınıflandırma ve Regresyon Ağaçları (Bagged CART), diğer yöntemlere göre (%83,7) daha yüksek doğrulukta COVID-19 şiddeti tahmin sonuçları vermiştir. Torbalı CART sınıflandırıcısından hesaplanan göreli özelliklere dayalı olarak yaş, kardiyovasküler hastalıklar, hipertansiyon ve diyabet en önemli dört özellik olarak tahmin edilmiştir. Önerilen yöntem ileride ortaya çıkabilecek farklı salgın hastalıklarda zaman kaybetmeden uygulanabilecektir.
Subject
General Earth and Planetary Sciences,General Environmental Science