Abstract
Şeker hastalığı insanlarda kan şekeri seviyesinin anormal değerlere ulaştığı kronik bir rahatsızlıktır. Şeker hastalığının erken teşhisi, bu hastalığın sebep olabileceği daha büyük hastalıkların önlenmesi ve gerekli tedavi planlamasının zamanında gerçekleştirilmesi açısından önemlidir. Bu çalışma kapsamında şeker hastalığı çeşitli modeller ile teşhis edilerek, bu problem için kullanılabilecek en uygun model belirlenmeye çalışılmıştır. Çalışmada Lojistik Regresyon, k-En Yakın Komşuluk, CART (Sınıflandırma ve Regresyon Ağacı), Rastgele Orman, Destek Vektör Makinesi, XGBoost ve LightGBM sınıflandırıcı modelleri kullanılmıştır. 10 katlı çapraz doğrulama yöntemi kullanılarak performans ölçütleri elde edilmiştir. Modellerin doğruluk oranları sırası ile %84,58, %84,59, %85,02, %88,29, %84,73, %89,29 ve %88,72 olarak elde edilmiştir. Modeller arasında en iyi üç doğruluk oranını veren Rastgele Orman, XGBoost ve LightGBM yöntemlerinde hiper-parametre ayarlaması gerçekleştirilerek en iyi parametreler belirlenmiştir. Bu parametreler ile final modellerinin doğruluk oranları sırasıyla %89,2998, %90,0141 ve %90,0121 olarak elde edilmiştir. Sonuç olarak XGBoost ve LightGBM modellerinin final teşhis modelleri olarak kullanılabileceği gözlemlenmiştir.
Publisher
Omer Halisdemir Universitesi
Subject
General Economics, Econometrics and Finance