Caminhando para uma Ciência Aberta: Uma abordagem estatística a partir da criação de resumos extrativos manuais e automáticos

Author:

Arias Arias Ivan,Oliveira Ramos de Castro Margarida

Abstract

Nos dias de hoje, a difusão de novos meios facilitou a proliferação de dados científicos, que podem ser divulgados graças a novas técnicas de tratamento da informação. Visa-se, neste artigo, a partir do fluxo de trabalho que se estabelece entre dados abertos e ciência de dados, analisar resumos gerados de forma manual e de forma automática em termos estatísticos. Assim, avaliam-se novas possibilidades de tornar o conhecimento científico mais acessível ao caminharmos para uma democracia de dados. Desta forma, tomando um corpus de textos resumidos como ponto de partida, realizar-se-ão análises quantitativas com recurso a fundamentos teóricos que permitirão retirar conclusões relativamente à viabilidade da automatização para atingirmos uma ciência aberta.

Publisher

University of Minho

Reference21 articles.

1. Atkins, S., Clear, J., & Ostler, N. (1992). Corpus Design Criteria. Literary and Linguistic Computing, 7(1),1-16.

2. Batarseh, F. A., & Yang, R. (2020). Data Democracy. At the nexus of artificial intelligence, software development, and knowledge engineering. Elsevier Academic Press.

3. Bird, S., Klein, E., & Loper, E. (2009). Natural Language Processing with Python. O’Relly.

4. Cavique, L. (2014). Big data e data science. Boletim da APDIO, 51, 11-14. http://hdl.handle.net/10400.2/3918

5. Cheng, J., & Lapata, M. (2016). Neural summarization by extracting sentences and words. Proceedings of the Association for Computational Linguistics (ACL), 484-494.

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线,采集、加工和组织学术论文而形成的新型学术文献查询和分析系统,可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容,当前同舟云学术共收录了国内外主流学术期刊6万余种,收集的期刊论文及会议论文总量共计约1.5亿篇,并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询!咨询电话:010-8811{复制后删除}0370

www.globalauthorid.com

TOP

Copyright © 2019-2024 北京同舟云网络信息技术有限公司
京公网安备11010802033243号  京ICP备18003416号-3