Author:
Ribeiro Iran F.,Brotto Guilherme S. G.,Comarela Giovanni,Mota Vinícius F. S.
Abstract
A análise de tráfego de dados gerados por dispositivos é fundamental para detecção e mitigação de ataques na Internet das Coisas. Contudo, dados públicos que representem ataques reais ainda são escassos. Visando aumentar a disponibilidade de dados, este trabalho apresenta um estudo do uso de Redes Generativas Adversárias (GANs) para gerar dados sintéticos de ataque em dispositivos IoT com alta fidelidade em relação aos dados reais, isto é, com características similares. Ao mesmo tempo visa garantir privacidade e que a utilidade dos dados sintéticos em tarefas de aprendizado de máquina sejam similares aos reais. Para isso, foram comparamos dois modelos de GANs, CTGAN e NetShare, utilizando como base um conjunto de dados contendo tráfego normal e com ataques em dispositivos IoT. Os resultados indicam que ambos os modelos de GANs são eficientes na geração de dados sintéticos, tanto em fidelidade quanto em qualidade. Entretanto, a CTGAN apresenta-se como o modelo mais eficiente, considerando tempo de execução e consumo de memória.
Publisher
Sociedade Brasileira de Computação - SBC
Reference25 articles.
1. Aleroud, A., Yang, F., Pallaprolu, S. C., Chen, Z., and Karabatis, G. (2021). Anonymization of network traces data through condensation-based differential privacy. Digital Threats: Research and Practice (DTRAP), 2(4):1–23.
2. Alex, C., Creado, G., Almobaideen, W., Alghanam, O. A., and Saadeh, M. (2023). A comprehensive survey for iot security datasets taxonomy, classification and machine learning mechanisms. Computers & Security, page 103283.
3. Arjovsky, M., Chintala, S., and Bottou, L. (2017). Wasserstein generative adversarial networks. In International conference on machine learning, pages 214–223. PMLR.
4. Borji, A. (2022). Pros and cons of gan evaluation measures: New developments. Computer Vision and Image Understanding, 215:103329.
5. Brock, A., Donahue, J., and Simonyan, K. (2018). Large scale gan training for high fidelity natural image synthesis.