Author:
González Granado Nicolás,Drouin Patrick,Picton Aurélie
Abstract
Les possibilités grandissantes pour la recherche en langues de spécialité confrontent les terminologues à des données de plus en plus vastes et hétérogènes, un contexte où les outils prêts à l'emploi s’avèrent insuffisants. Ce travail examine le potentiel de R, un langage de programmation populaire, pour analyser des corpus spécialisés complexes. Dans cet article, nous montrons comment identifier des indices de variation diastratique, phénomène compris ici comme la coexistence de différents usages linguistiques parmi des communautés d’experts d’un même domaine. Puisque l’un des points forts de R est sa capacité de s’adapter tant aux techniques des statistiques qu’à celles de l’apprentissage automatique, chacune de ces deux sphères fait l’objet d’une série de tests : l’une plonge dans la technique de l’analyse factorielle des correspondances, alors que l’autre s’appuie sur la sémantique distributionnelle. Nos exemples permettent d’alimenter la réflexion sur les possibilités offertes par différents outils gratuits et courants pour l’analyse terminologique. Notre démarche fait en particulier ressortir un besoin de formation des terminologues aux méthodes statistiques ou de collaboration étroite avec d’autres spécialistes de ces approches.
Subject
Linguistics and Language,Language and Linguistics
Reference64 articles.
1. Linguistic Research https://doi.org/10.17250/khisli.30.2.201308.001 ANTHONY, L. 2013. « A critical look at software tools in corpus linguistics », vol. 30 (2), p. 141-161.
2. AntConc https://www.laurenceanthony.net/software/antconc/ — . 2019. (Version 3.5.8), Tokyo, Waseda University. < >.
3. A practical handbook of corpus linguistics https://doi.org/10.1007/978-3-030-46216-1_9 — . 2021. « Programming for corpus linguistics », dans Magali Paquot, Stefan Th. Gries, . Cham : Springer, p. 181-207.
4. Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Volume 1 : Long Papers) https://doi.org/10.3115/v1/P14-1023 BARONI, M. DINU, G. KRUSZEWSKI, G. 2014. « Don’t count, predict ! A systematic comparison of context-counting vs. Context-predicting semantic vectors », . Baltimore : Association for Computational Linguistics, p. 238-247.
5. Analyse des correspondances : Exposé élémentaire BENZECRI, J.-P. 1984. . Paris : Dunod.