Affiliation:
1. MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ, TEKNOLOJİ FAKÜLTESİ, BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ
Abstract
Bir metin sınıflandırma problemi olarak duygu analizi, çevrimiçi metin belgelerinden öznel bilgi çıkarmanın kritik bir görevidir. Metin sınıflandırmanın önemli bir sorunu ise yüksek boyutluluktur. Boyut indirgeme, makine öğreniminde sınıflandırma performansını iyileştirmenin etkili bir yoludur. Alakasız özniteliklerin azaltılması eğitim süresini kısaltabilmekte ve sınıflandırma doğruluğunu artırabilmektedir. Farklı öznitelik seçim yöntemlerinin performansı, farklı veri kümelerinin özelliklerine bağlı olarak değişebilmektedir. Bu çalışmada filtre tabanlı 6 farklı öznitelik seçimi yönteminin (Korelasyon tabanlı öznitelik seçimi, Ki-kare, Kazanç oranı, Bilgi kazancı, OneR ve Simetrik belirsizlik katsayısı) performansı duygu sınıflandırmasında sıklıkla kullanılan 9 farklı veri kümesi üzerinde test edilmiş ve karşılaştırılmıştır. Bütün veri kümelerinde her bir öznitelik seçimi yöntemi için filtre puanları hesaplanmıştır. Elde edilen filtre puanları büyükten küçüğe sıralanmıştır. En yüksek filtre puanına sahip öznitelikten en düşük filtre puanına sahip özniteliğe doğru öznitelikler bir önceki alt kümeye eklenerek yeni alt kümeler oluşturulmuş ve sınıflandırılmıştır. Hesaplama sonuçları, önerilen yaklaşımın 9 genel duygu sınıflandırma veri kümesi için Çok terimli Naive Bayes sınıflandırıcısını kullanarak ortalama %94.34 doğruluk oranlarına ulaştığını göstermektedir. Arama uzayı dikkate alındığında, bu yaklaşımın geliştirilebilir ve mevcut yaklaşımlarla rekabet edebilir olduğu sonucuna varılabilir.
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献