Affiliation:
1. EGE UNIVERSITY, FACULTY OF ENGINEERING
Abstract
Dizi eşleştirme algoritmaları tıp, biyoinformatik, biyoloji gibi birçok alandaki çeşitli uygulamaları nedeniyle bilgisayar bilimindeki önemli çalışma konularından olmuştur. Son yıllarda yeni algoritmalar geliştirilerek metin üzerinde dizi eşleştirme işlemleri hızlandırılmıştır. Dizi eşleştirme algoritmaları tekli ve çoklu olmak üzere iki kısma ayrılır. Çoklu kesin dizi eşleştirme algoritmaları verilen bir T metni içinde d adet P desenlerinin bulunmasını içerir. Bu çalışmada, hash tabanlı çoklu kesin dizi eşleştirme algoritmalarından olan Wu-Manber algoritması ele alınmıştır. Wu-Manber algoritması etkili bir algoritma olmasına rağmen hash çakışmaları gibi bazı kısıtlamalara sahiptir. Çalışmamızda bu eksikliklere yönelik yeni yaklaşım önerilmiştir. Önerilen yaklaşımda, geleneksel Wu-Manber algoritmasının aksine, DNA sekanslarında hash çakışmasını kaldıran hash fonksiyonu kullanarak dizilerdeki arama işlemi q-gram hash karşılaştırması ile gerçekleştirilmiştir. Önerilen yaklaşım literatürde sıkça kullanılan çoklu kesin dizi eşleştirme algoritmalarıyla E. Coli ve Human Chromosome1 veri setinde karşılaştırmalar yapılmıştır. Yapılan deneysel çalışmalar sonucu önerilen yöntemin Wu-Manber algoritmasına kıyasla önerilen yaklaşımda ortalama çalışma zamanı, ortalama karakter ve hash karşılaştırma sayısı gibi performans metrikleri açısından daha iyi sonuçlar elde edilmiştir. Ayrıca, önerilen yaklaşımın Aho Corasick (AC) ve Commentz Walter (CW) gibi iyi bilinen algoritmalardan daha verimli olduğu gösterilmiştir.
Publisher
Journal of the Faculty of Engineering and Architecture of Gazi University
Subject
General Engineering,Architecture
Reference26 articles.
1. 1. Sukhanov S., Wu R., Debes C., Zoubir A. M. Dynamic pattern matching with multiple queries on large scale data streams. Signal Processing, 171, 107402, 2020. Doi: 10.1016/j.sigpro.2019.107402
2. 2. Song S., Gu G., Ryu C., Faro S., Lecroq T., Park K. Fast algorithms for single and multiple pattern Cartesian tree matching. Theoretical Computer Science, 849, 47-63, 2021. Doi: 10.1016/j.tcs.2020.10.009
3. 3. Aldwairi M., Hamzah A. Y., Jarrah M. MultiPLZW: a novel multiple pattern matching search in LZW-compressed data. Computer Communications, 145, 126-136, 2019. Doi: 10.1016/j.comcom.2019.06.011
4. 4. Kumar S., Singh S., Khatoon A., Agarwal S. A Multiple String and Pattern Matching Algorithm Using Context-Free Grammar, In Emerging Trends in Expert Applications and Security, Springer, Singapore, vol. 841, 97-102, 2019. Doi: 10.1007/978-981-13-2285-3_12
5. 5. Singh M., Sharma V. ASCII based Sequential Multiple Pattern Matching Algorithm for High Level Cloning. INTERNATIONAL JOURNAL OF ADVANCED COMPUTER SCIENCE AND APPLICATIONS, 8(6), 271-276, 2017. Link: https://pdfs.semanticscholar.org/df05/c9dda727a6ed18a3b840e1a3f53abbd71ee4.pdf
Cited by
4 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献