Affiliation:
1. MUSTAFA KEMAL ÜNİVERSİTESİ, ANTAKYA MESLEK YÜKSEKOKULU
Abstract
Günümüz iş modellerinde kurum veya kuruluşlar, karar alma süreçlerini iyileştirmek için kullanıcıların görüşlerini bilmek istemektedir. Dünyanın dört bir yanındaki milyonlarca insan, sosyal ağ uygulamaları aracılığıyla metin mesajları, videolar veya fotoğraflar kullanarak günlük yorumlarını ve düşüncelerini ifade etmektedir. Facebook, Instagram, Twitter ve YouTube gibi sosyal ağ uygulamalarının hızla büyümesi, burada paylaşılan büyük verilerin içeriğini araştırmak ve kullanıcı davranışlarını analiz etmek için araştırmacılara çekici bir alan sunmaktadır. Sosyal ağlardan gelen bu muazzam miktardaki veri, etkili pazarlama, kişiselleştirilmiş öneri sistemleri, fikir liderleri bulma, ilaç endüstrisi veya politik analizler için kullanılmaktadır. Sosyal ağ uygulamaları aracılığıyla elde edilen büyük miktarda veri, makine öğrenme yöntemleriyle analiz edilmektedir. Bu çalışmada Twitter kullanıcılarının otomatik cinsiyet sınıflandırması performansını artırmak için nitelik seçim yöntemi kullanılmıştır. Twitter kullanıcı tanımları, twit metinleri ve her ikisinin bir arada kullanıldığı üç veri kümesi üzerinde uygulanan nitelik seçim yönteminin performansı naive bayes ve lojistik regresyon sınıflayıcıları ile değerlendirilmiştir. Deney sonuçları ki-kare nitelik seçim yöntemi ile seçilen niteliklerin lojistik regresyon ile sınıflandırma başarısının çok daha üstün olduğunu göstermektedir.
Publisher
Uluslararasi Muhendislik Arastirma ve Gelistirme Dergisi
Reference15 articles.
1. Daneshvar, S., ve Inkpen, D. (2018). Gender identification in twitter using n-grams and lsa. Paper presented at the proceedings of the ninth international conference of the CLEF association (CLEF 2018).
2. Han, J., ve Kamber, M. (2006). Data Mining: Concepts and Techniques (Second ed.): The Morgan Kaufmann Series in Data Management Systems.
3. Jin, C., Ma, T., Hou, R., Tang, M., Tian, Y., Al-Dhelaan, A., ve Al-Rodhaan, M. (2015). Chi-square statistics feature selection based on term frequency and distribution for text categorization. IETE journal of research, 61(4), 351-362.
4. Kaggle. (2016). Twitter User Gender Classification. Retrieved from https://www.kaggle.com/datasets/crowdflower/twitter-user-gender-classification?select=gender-classifier-DFE-791531.csv
5. Khandelwal, A., Swami, S., Akhtar, S. S., ve Shrivastava, M. (2018). Gender Prediction in English-Hindi Code-Mixed Social Media Content: Corpus and Baseline System. Computacion Y Sistemas, 22(4), 1241-1247. doi:10.13053/CyS-22-4-3061
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献