Affiliation:
1. Alma Mater Europaea, ECM, Maribor, Slovenija
Abstract
Namen prispevka je raziskovati tehnike ekstrakcije metapodatkov s pomočjo strojnega učenja. Uporabljena je bila metoda pregleda literature iz podatkovnih baz ProQuest, Scopus in Emerald Insight. Rezultati so pokazali, da so tehnike strojnega učenja že uveljavljene na področju ekstrakcije metapodatkov iz znanstvene literature. Najboljše rezultate so pokazale rešitve, ki združujejo analizo postavitve dokumenta in proces ekstrakcije metapodatkov. Glede na raziskave o ekstrakciji metapodatkov s pomočjo strojnega učenja lahko sklepamo, da je treba dodatno analizirati orodja in modele strojnega učenja GROBID, CERMINE, XTRACT, BERT, Mask R‑CNN in BiLSTM. Na podlagi izkušnjah ekstrakcije metapodatkov iz znanstvene literature je treba prilagoditi modele za ekstrakcijo metapodatkov iz arhivskega gradiva.
Publisher
Pokrajinski arhiv Maribor
Subject
Library and Information Sciences,Public Administration
Reference32 articles.
1. Bijari, K. (2022). Enhanced Semi-Automated Metadata Extraction, Acquisition, and Management via Web Technologies and Machine Learning Models for NeuroMorpho.Org. Doktorska disertacija. Fairfax: George Mason University.
2. Bouabdallah, A, Gavilan J., Gerbl J. in Patumcharoenpol, P. (2021). Multimodal Approach for Metadata Extraction from German Scientific Publications. Pridobljeno 18. julija 2023 s spletne strani: https://arxiv.org/abs/2111.05736. DOI: https://doi.org/10.48550/arXiv.2111.05736.
3. Boukhers, Z., Beili, N., Hartmann, T., Goswami, P. in Zafar, A.. (2021). MexPub: Deep Transfer Learning for Metadata Extraction from German Publications. 2021 ACM/IEEE Joint Conference on Digital Libraries (JCDL). URL: https://ieeexplore.ieee.org/document/9651740. DOI: https://doi.org/10.1109/JCDL52503.2021.00076.
4. Brownlee, J. (2017). Deep Learning for Natural Language Processing. San Juan: Machine Learning Mastery.
5. Choi, J., Kong, H., Yoon, H., Oh, H. S., in Jung, Y. (2021). LAME: Layout Aware Metadata Extraction Approach for Research Articles. Pridobljeno 18. julija 2023 s spletne strani: https://arxiv.org/abs/2112.12353. DOI: https://doi.org/10.48550/arXiv.2112.12353.