Author:
Mendonça Marcos Paulo Cezar de,Moraes Igor Monteiro,Mattos Diogo Menezes Ferrazani
Abstract
A avaliação da credibilidade de sítios web que propagam notícias é uma atividade crítica no combate à desinformação. Sítios web de baixa confiabilidade são por vezes apontados como a origem das notícias falsas propagadas e amplificadas em redes sociais. Este artigo propõe uma avaliação automática da credibilidade dos sítios web, sem a necessidade de varredura de todo o conteúdo do sítio. Diferente de trabalhos anteriores que focam nas redes sociais, este artigo utiliza características publicamente disponíveis dos sítios web, como as características do domínio, geolocalização e do certificado TLS, para identificar sítios web confiáveis e não confiáveis, usando técnicas de aprendizado de máquina supervisionado. O artigo propõe um modelo de aprendizado supervisionado e consolida um conjunto de dados de sítios confiáveis e não confiáveis. O modelo foi treinado e avaliado com dados disjuntos e foi possível identificar de forma eficaz, com precisão maior que 75%, sítios web confiáveis e não confiáveis, contribuindo para combate à disseminação de notícias falsas e de desinformação.
Publisher
Sociedade Brasileira de Computação - SBC