Abstract
El objetivo de esta artículo radica en extraer las temáticas de investigación de los resúmenes y datos bibliográficos de los artículos indexados en la base de datos Scopus y que tienen como objeto de estudio al departamento del Chocó (Colombia). De esta manera, se buscaron las palabras clave Chocó AND Colombia en la base de datos Scopus, se exportaron las referencias bibliográficas a EndNote y se extrajeron los datos de autor(es), título, publicación periódica, volumen, número, año y resumen, se convirtieron en un archivo de texto, se eliminaron referencias y símbolos. La manipulación del archivo en pdf se realizó con la ejecución de preparación del texto, tokenización, lematización y obtención de lista de bigrams que se efectuaron en el entorno de desarrollo integrado (EDI) de RStudio. Así, se encontraron 668 registros bibliográficos de documentos indexados en Scopus. Las palabras con el mayor número de frecuencia de aparición: «species», «Colombia», «Chocó», «forest», «pacific», «tropical», etcétera. Se encontraron 89 841 bigrams, entre los que destacan «new species», «pacific coast», «colombian pacific», entre otros. Las colocaciones de palabras muestran que «gold» combina con «mining», «mercury», «platinum», y así sucesivamente. «Chocó» combina con «Colombia», «biogeographical», «rain», «tropical», y demás. «Biodiversity» combina con «conservation», «tropical», «agricultural», etcétera. «Climate» combina con «change», «variability», «basin», y más. Se concluye que las palabras más frecuentes evidencian que hay una preocupación por el estudio de la minería, la biodiversidad, el cambio climático, el bosque tropical, el océano pacífico, entre otros.
Publisher
Universidad Nacional Autonoma de Mexico
Subject
Library and Information Sciences
Reference45 articles.
1. Al-Betar, M. A., Abasi, A. K., Al‑Naymat, G., Arshad K. y Makhadmeh S. N. 2023. Optimization of scientific publications clustering with ensemble approach for topic extraction. Scientometrics, (128): 2819–2877. https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-023-04674-w.
2. Alkan, B. B., Karakuş L. y Direkci B. 2023. Knowledge discovery from the texts of Nobel Prize winners in literature: sentiment analysis and Latent Dirichlet Allocation. Scientometrics, (128): 5311–5334 (2023). https://doi-org.biblioteca-colmex.idm.oclc.org/10.1007/s11192-023-04783-6.
3. Benoit, K. y Nulty P. 2016. quanteda: Quantitative Analysis of Textual Data. Consultado 2 de agosto, 2023. https://CRAN.R-project.org/package=quanteda
4. Callon, M., Courtial J. P. y Laville F. 1991. Co-word analysis as a tool for describing the network of interactions between basic and technological research: the case of polymer chemistry. Scientometrics, 22: 155-205.
5. Csardi, G. y Nepusz, T. 2006. The igraph software package for complex network research. InterJournal Complex Systems, 1695. Consultado 2 de Agosto, 2023. https://igraph.org.