EMACrawler: Web Arama Motoru Veritabanı Tazeliği Optimizasyonu

Author:

ALANOĞLU Zülfü1ORCID,AKCAYOL M. Ali2ORCID

Affiliation:

1. MUSTAFA KEMAL ÜNİVERSİTESİ

2. GAZİ ÜNİVERSİTESİ, MÜHENDİSLİK FAKÜLTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Abstract

Günümüz bilgi ve teknoloji çağında arama motorları hayatımızın önemli bir parçası haline gelmiştir. Her ne kadar bilgiye erişimde ilk başvurulan arama motorları olsa da kullanıcılara sunulan içerikte eski ve gereksiz bilgiler yer almaktadır. Güncel verileri sağlamak açısından günümüzdeki arama motorları çoğunlukla istenen başarıyı sunamamaktadır. Web tarayıcılarının sunduğu verilerin güncelliğini sağlamak için tekrar ziyaret zamanının doğru tahmin edilmesi gerekmektedir. Bu çalışmada arama motorlarının performanslarını etkileyen en önemli özellik olan tekrar ziyaret zamanlarının belirlenmesi için üstel hareketli ortalamaya dayanan EMACrawler önerilmiştir. Önerilen yöntem kesinlik, toplam kapsama alanı ve verimlilik metrikleri kullanılarak test edilmiştir. EMACrawler’ın web sayfalarındaki güncel veriyi doğru tahmin zamanında ve hızlı bir şekilde elde ettiği görülmüştür. Yapılan deneysel çalışmaların sonucunda EMACrawler’ın güncel verilerin elde edilmesi ve tarayıcı veri tabanının tazeliğinin korunmasında diğer yöntemlerden daha başarılı olduğu görülmüştür.

Funder

Türkiye Bilimsel ve Teknolojik Araştırma Kurumu

Publisher

Politeknik Dergisi

Reference33 articles.

1. [1] Google,"How Google Search Works", www.google.com, [Erişim Tarihi: 10/08/2022).

2. [2] Sadiku M., Musa S., and Nelatury S. R., "Future Internet research," International Journal of Advances in Scientific Research and Engineering (IJASRE), Erie, PY 2(3):23-25, (2017).

3. [3] Jaiganesh S., Babu P., and Satheesh K. N., "Comparative study of various web search algorithms for the improvement of web crawler," Int. J. Eng. Res. Technol.(IJERT), 4(2): (2013).

4. [4] Li K., Fei J., and Fan C., "Optimization and application of web crawler architecture," SPIE, 12506: 151-155, (2022).

5. [5] Patil T. A. and Chobe S., "Web Crawler for searching Deep web sites," in 2017 International Conference on Computing, Communication, Control and Automation (ICCUBEA), Pune, India,1-5 (2017).

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线,采集、加工和组织学术论文而形成的新型学术文献查询和分析系统,可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容,当前同舟云学术共收录了国内外主流学术期刊6万余种,收集的期刊论文及会议论文总量共计约1.5亿篇,并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询!咨询电话:010-8811{复制后删除}0370

www.globalauthorid.com

TOP

Copyright © 2019-2024 北京同舟云网络信息技术有限公司
京公网安备11010802033243号  京ICP备18003416号-3