O papel dos vocabulários no acesso e reuso dos Big Data

Author:

Marcondes Carlos HenriqueORCID,Ramos Junior Mauricio Augusto CabralORCID,Martins Sergio De CastroORCID

Abstract

Objetivo: De forma similar à “explosão informacional” o fenômeno do Big Data vem sendo de forma crescente, objeto da CI/OC. Como descobrir, acessar, processar e reusar a enorme e crescente quantidade de dados que são disponibilizados continuamente na Web por nossa sociedade? Em especial, como tratar os chamados “dados não estruturados”, documentos textuais, que sempre foram o objeto da CI/OC? Metodologia: Teorias de amplo espectro como Ontologia e Semiótica foram utilizadas para analisar dados como elemento essencial do Big Data, em especial os “dados não estruturados”. Resultados: A partir da análise de várias definições de dados, um dado é identificado como parte de esquemas lógicos e semióticos já conhecidos, as proposições. Um dado é encontrado juntamente com outros, formando conjuntos de dados. Conjuntos de dados são na verdade conjuntos de proposições. Estas estão presentes no que é conhecido como dados estruturados - tabelas de bancos de dados relacionais ou de planilhas. Documentos textuais também contém conjuntos de proposições. Dados estruturados são comparados com “dados não estruturados”. Conclusões: Embora no limite, ambos contenham proposições e possam ser equivalentes, enquanto conjuntos, dados estruturados são expressos e percebidos como um todo, conjuntos de dados não estruturados são processuais, expressos sequencialmente o que torna mais difícil a identificação de dados não estruturados em documentos textuais para seu processamento por máquinas.

Publisher

Universidade Estadual de Londrina

Subject

General Economics, Econometrics and Finance

Reference35 articles.

1. ANDRADE, M. C.; GONÇALEZ, P. R. V. A.; BERTI JUNIOR, D. W; BAPTISTA, A. A.; CONEGLIAN, C. S. Responsible data science: Impartiality, accuracy, confidentiality and transparency of data. Informação & Informação, Londrina, v. 25, n. 2, p. 26-48, 2020.

2. ARISTÓTELES. Categorias. Lisboa: Instituto Piaget, 2000.

3. BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The semantic web. Scientific American, may, 2001.

4. BUNGE, M. Treatise on Basic Philosophy. In: BUNGE, M. Ontology I: The furniture of the World. Dordrecht, Holland, Boston, USA: D Reidel Publishing, 2015.v.3

5. CAPURRO, R. Angeletics -A Message Theory. In: DIEBNER, H. H.; RAMSAY, D. L. (ed.). Hierarchies of Communication. Karlsruhe: ZKM - Center for Art and Media, 2003.

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线,采集、加工和组织学术论文而形成的新型学术文献查询和分析系统,可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容,当前同舟云学术共收录了国内外主流学术期刊6万余种,收集的期刊论文及会议论文总量共计约1.5亿篇,并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询!咨询电话:010-8811{复制后删除}0370

www.globalauthorid.com

TOP

Copyright © 2019-2024 北京同舟云网络信息技术有限公司
京公网安备11010802033243号  京ICP备18003416号-3