Author:
Mohr Guilherme Alan,Silva Gustavo Pinto da,Brandão Janaína Balk,Lichtnow Daniel
Abstract
Este artigo descreve o processo de construção de um dataset que reúne dados públicos relativos à produção e comercialização de produtos da horticultura e fruticultura no Brasil extraídos de diferentes fontes utilizando o processo de Web Scraping. Para compor a versão inicial do dataset, foram extraídos dados do Censo Demográfico de 2010, Sistema IBGE de Recuperação Automática (SIDRA) e da Companhia Nacional de Abastecimento (CONAB). Por fim, é apresentado uma descrição dos dados extraídos e de possíveis usos.
Publisher
Sociedade Brasileira de Computação - SBC