Affiliation:
1. Universidad Técnica de Manabí
Abstract
Los corpus de texto relacionados con incidencias ciudadanas son escasos y el proceso de anotación, para determinar si se trata de una emergencia, normalmente se realiza de forma manual a través de anotadores humanos. Esta forma de realizar el proceso a menudo produce resultados aceptables, pero son más lentos, costosos, y factibles únicamente para conjuntos con volumen pequeño o que no requieren procesamiento en tiempo real. Realizar anotaciones con anotadores humanos para corpus de emergencias, las que por su naturaleza requieren acciones inmediatas, no parece ser ideal, sobre todo cuando se reportan en redes sociales como X. En este artículo se propone un enfoque para el anotado semiautomático de eventos de emergencia reportados en X, basado en aprendizaje automático y computación evolutiva. Se utilizó la metodología CRISP-DM con seis etapas: comprensión del problema, recolección, y comprensión de datos, modelado, validación y despliegue. Los experimentos computacionales muestran un buen desempeño cuando se utiliza como modelo el clasificador de vectores de soporte lineal (LSVC), cuyos hiper-parámetros son optimizados con un algoritmo de computación evolutiva. Se alcanzaron valores promedio de 0.976 y 0.963 de F1-Score, así como 0.96 y 0.97 del coeficiente correlación de Matthews, para anotar la etiqueta de emergencia en +170 mil tweets para la clasificación binaria y multiclase, respectivamente. Se concluye que es posible tener un enfoque eficaz para asignar la etiqueta de emergencia a los textos publicados en la red social X, gracias a la optimización de los valores de los parámetros de los modelos de clasificación de aprendizaje automático.
Publisher
Universidad Laica Eloy Alfaro de Manabi