Affiliation:
1. TÜRKİYE BİLİMSEL VE TEKNOLOJİK ARAŞTIRMA KURUMU BAŞKANLIĞI
2. BAŞKENT ÜNİVERSİTESİ
Abstract
Birçok farklı sektörde metin halinde bulunan verilerden istenilen bilgilerin elde edilmesi için doğal dil işleme, metin madenciliği ve derin öğrenme yöntemleri kullanılmaktadır. Son zamanlarda artan Ar-Ge proje sayıları ve farklılaşan proje faaliyet alanları ile birlikte Ar-Ge projelerinin ait olduğu araştırma alanlarının belirlenmesi ve bu araştırma alanlarına uygun hakemlerin tespitinde yaşanan sıkıntılar nedeniyle projelerin desteklenme süreçleri olumsuz etkilenebilmektedir. Bu makalede, Ar-Ge projelerinin sınıflandırılması amacıyla öncelikli olarak çalışmanın gerçekleştirildiği veri tabanındaki veriler temizlenmiş ve doğal dil tekniklerinden biri olan “Word2Vec” kelime temsili yöntemi ile otomatik özellik öğrenme yaklaşımı kullanılarak özelliklerin sınıflandırılması amacıyla Evrişimsel Sinir Ağları (CNN-Convolutional Neural Network) modelleri oluşturulmaya çalışılmıştır. TUBİTAK Dergipark sitesinden seçilen ve sınıfları belli olan Ar-Ge projeleri ve Ar-Ge proje içeriğine sahip makalelerden oluşan veri kümesi üzerinde yapılan deneysel çalışmalardan elde edilen değerlendirme sonuçları ile diğer klasik algoritmalar karşılaştırılmış ve özellikle Word2Vec modellerine sahip CNN’lerin daha etkili sonuçları ürettiği birçok performans parametresi ile gösterilmiştir.
Publisher
Journal of the Faculty of Engineering and Architecture of Gazi University
Subject
General Engineering,Architecture
Reference36 articles.
1. Türkiye Bilimsel Ve Teknolojik Araştırma Kurumu (TÜBİTAK) Faaliyet Raporları (2019), https://www.tubitak.gov.tr/sites/default/files/18842/tubitak_2019_yili_faaliyet_raporu.pdf sayfasından erişilmiştir, 2019.
2. Kowsari K., Meimandi K.J., Heidarysafa M., Mendu S., Barnes L.E., Brown D.E., Text Classification Algorithms: A Survey, Information, 10, 2019.
3. LeCun Y., Bengio Y., Hinton G., Deep learning, Nature 2015, 521, 436–444, 2015.
4. Szczepaniak P.S., Tomczyk A., Pryczek M., Supervised Web Document Classification using Discrete Transforms, Active Hypercontours and Expert Knowledge, Lecture notes in Computer Science, 305–323, 1982.
5. Sharma A.K., Chaurasia S., Srivastava D.K., Sentimental Short Sentences Classification by Using CNN Deep
Learning Model with Fine Tuned Word2Vec, Procedia Computer Science 167, 1139–1147, 2020.
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献
1. Türkçe Doğal Dil İşleme: Ses Bilgisi ve Morfolojik Analiz;Journal of Innovative Engineering and Natural Science;2024-07-03