Affiliation:
1. Facultad de Ciencias. Escuela Politécnica Nacional
2. Facultad de Ingeniería en Sistemas. Escuela Politécnica Nacional
Abstract
Uno de los delitos cibernéticos más reportados a nivel mundial es el phishing. En la actualidad se están desarrollando diversos sistemas anti-phishing (APS) para identificar este tipo de ataque en sistemas de comunicación en tiempo real. A pesar de los esfuerzos de las organizaciones, este ataque continúa creciendo, teniendo como causas: la detección errónea en el ataque de día cero, el alto costo computacional y las tasas altas de falsificación. Aunque el enfoque de Machine Learning (ML) ha logrado una tasa de precisión favorable, se debe considerar que la elección y el rendimiento del vector de características es un punto clave para obtener un nivel de precisión adecuado. En este trabajo, se propone un modelo predictivo basado en ML y en el análisis de la eficiencia de algunos esquemas anti-phishing que sirvieron para entender esta temática. El modelo propuesto consta de un módulo de selección de características que se utiliza para la construcción del vector final. Estas características se extraen de la URL, las propiedades de la página web y del corpus de correo electrónico. El sistema utiliza los modelos de clasificación, Random Forest (RF) y Naïve Bayes (NB), que han sido entrenados en el vector de características. Los experimentos se basaron en Dataset compuestas por instancias de phishing y benignas. Mediante el uso de la validación cruzada, los resultados experimentales indican una precisión del 97,5% para los dataset utilizados, mientras que para el abordaje de esta investigación a nivel local se obtuvo una precisión del 96,5%.
Publisher
Escuela Politecnica Nacional
Subject
Applied Mathematics,Geochemistry and Petrology,Physics and Astronomy (miscellaneous),General Engineering,Geotechnical Engineering and Engineering Geology,Environmental Engineering,Chemistry (miscellaneous)
Reference39 articles.
1. Aburrous, M., Hossain, M., Dahal, K. and Thabtah, F. (2010). Experimental case studies for investigating e-banking phishing techniques and attack strategies Cognit. Comput. (2), 242–253 https://doi.org/10.1007/s12559-010-9042-7
2. Adebowale, M., Lwin, K., Sanchez, E. and Hossain, M. (2018). Intelligent Web-Phishing Detection and Protection Scheme using integrated Features of Images, Frames and Text. Expert System with Applications. (115), 300-313 https://doi.org/10.1016/j.eswa.2018.07.067
3. Amat Rodrigo, Joaquín. (2020). Análisis de texto (text mining) con Python, cienciadedatos.net. Obtenido de: https://www.cienciadedatos.net/. (Diciembre, 2020).
4. Anwar, T., Abu-Kresha, M. and Bakry A. (2017). An efficient method for web page classification based on text. International J. Eng. Comput. Sci.
5. Barraclough, P. & Sexton, G. (2015). Phishing website detection fuzzy system modelling, IEEE, London, UK, 1384-1386, 10.1109/SAI.2015.7237323.