Affiliation:
1. KARADENIZ TECHNICAL UNIVERSITY
2. KARADENİZ TEKNİK ÜNİVERSİTESİ
Abstract
Gerçek kişilerin konuşmalarını içeren dijital ses dosyalarının kullanılması ile gerçekleştirilen derin sahte ses manipülasyonu, sesi taklit edilecek kişinin sesini klonlayarak kişinin söylemediği bir şeyi söylemiş gibi içerikte ses dosyalarını oluşturan bir sahtecilik türüdür. Konuşmacının kimliğini doğrulamak için güvenlik adımı olarak kabul edilen Otomatik Konuşmacı Doğrulama Sistemlerinin derin sahte ses sahtecilikleri saldırılarına karşı savunmasızlığı söz konusudur. Ayrıca mahkemelerde karar merciini etkileyecek delil olarak sunulan ses dosyalarının orijinal olup olmadığı kontrolü önemli bir ihtiyaç haline gelmiştir. Bu tür sahteciliklerin uzman sistemler tarafından tespit edilebilmesi günümüz çağı için oldukça önem arz etmektedir. Bu sahtecilik türündeki saldırıların tespit edilebilmesi için literatürde çeşitli yöntemler önerilmiştir. Literatürdeki çalışmalarda performans değerlendirmesinde kullanılan ücretsiz erişimli veri setleri de mevcut olup sonuç kıyaslamasında kullanabilmesi mümkündür. Bu çalışmada literatürdeki yöntemler ve verisetleri incelenmiş, yöntemlerin bu verisetleri üzerindeki performans değerlendirmeleri, avantaj ve dezavantajları vurgulanmıştır.
Funder
Türkiye Bilimsel ve Teknolojik Araştırma Kurumu
Publisher
Van Yuzuncu Yil University
Reference46 articles.
1. Abdzadeh, P., & Veisi, H. (2023). A comparison of CQT spectrogram with STFT-based acoustic features in Deep Learning-based synthetic speech detection. Journal of AI and Data Mining, 11(1), 119-129. doi:10.22044/jadm.2022.12373.2382
2. Alluri, K. N. R. K., & Vuppala, A. K. (2019, September). IIIT-H spoofing countermeasures for automatic speaker verification spoofing and countermeasures challeng. Interspeech 2019, Graz, Austria. doi:10.21437/Interspeech.2019-1623
3. Alzantot, M., Wang, Z., & Srivastava, M. B. (2019, September). Deep residual neural networks for audio spoofing detection. Interspeech 2019, Graz, Austria. doi:10.21437/Interspeech.2019-3174
4. Balamurali, B. T., Lin, K. W. E., Lui, S., Chen, J. M., & Herremans, D. (2019). Toward robust audio spoofing detection: a detailed comparison of traditional and learned features. IEEE Access, 7, 84229-84241. doi:10.1109/ACCESS.2019.2923806
5. Borrelli, C., Bestagini, P., Antonacci, F., Sarti, A., & Tubaro, S. (2021). Synthetic speech detection through short-term and long-term prediction traces. EURASIP Journal on Information Security, 2021, 2. doi:10.1186/s13635-021-00116-3