Author:
Arias Arias Ivan,Oliveira Ramos de Castro Margarida
Abstract
Nos dias de hoje, a difusão de novos meios facilitou a proliferação de dados científicos, que podem ser divulgados graças a novas técnicas de tratamento da informação. Visa-se, neste artigo, a partir do fluxo de trabalho que se estabelece entre dados abertos e ciência de dados, analisar resumos gerados de forma manual e de forma automática em termos estatísticos. Assim, avaliam-se novas possibilidades de tornar o conhecimento científico mais acessível ao caminharmos para uma democracia de dados. Desta forma, tomando um corpus de textos resumidos como ponto de partida, realizar-se-ão análises quantitativas com recurso a fundamentos teóricos que permitirão retirar conclusões relativamente à viabilidade da automatização para atingirmos uma ciência aberta.
Reference21 articles.
1. Atkins, S., Clear, J., & Ostler, N. (1992). Corpus Design Criteria. Literary and Linguistic Computing, 7(1),1-16.
2. Batarseh, F. A., & Yang, R. (2020). Data Democracy. At the nexus of artificial intelligence, software development, and knowledge engineering. Elsevier Academic Press.
3. Bird, S., Klein, E., & Loper, E. (2009). Natural Language Processing with Python. O’Relly.
4. Cavique, L. (2014). Big data e data science. Boletim da APDIO, 51, 11-14. http://hdl.handle.net/10400.2/3918
5. Cheng, J., & Lapata, M. (2016). Neural summarization by extracting sentences and words. Proceedings of the Association for Computational Linguistics (ACL), 484-494.