Abstract
La lexicometría es un método que nos permite identificar unidades temáticas derivadas de la extracción automática de patrones de conocimiento en datos de naturaleza textual (Romero, Alarcón y García, 2018). De su aplicación emergen las tendencias léxicas de un corpus a través de la cuantificación de la ocurrencia de las palabras. Los distintos estilos léxicos sociolingüísticos se han estudiado en amplias variedades de las lenguas del mundo, incluida la lengua española. Sin embargo, no existen, en los estudios llegados a nuestro alcance hasta el momento, suficientes análisis cuantitativos del léxico de un corpus sociolingüístico oral contemporáneo.
El objetivo general de este artículo es detectar las preferencias de uso del vocabulario de la lengua española hablada en el marco de la lexicometría sociolingüística. Para ello, se analizó una muestra representativa de un corpus estratificado en torno a tres variables (sexo, edad, nivel educativo). Dicha muestra pertenece al corpus PRESEEA-Santander, enmarcado en el Proyecto para el Estudio Sociolingüístico del Español de España y América (Moreno Fernández, 2021). En el análisis se empleó el sistema LYNEAL (Letras y Números en Análisis Lingüístico) (Autor, 2021), así como el software estadístico en código abierto R.
La lexicometría es un método que nos permite identificar unidades temáticas derivadas de la extracción automática de patrones de conocimiento en datos de naturaleza textual (Romero, Alarcón y García, 2018). De su aplicación emergen las tendencias léxicas de un corpus a través de la cuantificación de la ocurrencia de las palabras. Los distintos estilos léxicos sociolingüísticos se han estudiado en amplias variedades de las lenguas del mundo, incluida la lengua española. Sin embargo, no existen, en los estudios llegados a nuestro alcance hasta el momento, suficientes análisis cuantitativos del léxico de un corpus sociolingüístico oral contemporáneo.El objetivo general de este artículo es detectar las preferencias de uso del vocabulario de la lengua española hablada en el marco de la lexicometría sociolingüística. Para ello, se analizó una muestra representativa de un corpus estratificado en torno a tres variables (sexo, edad, nivel educativo). Dicha muestra pertenece al corpus PRESEEA-Santander, enmarcado en el Proyecto para el Estudio Sociolingüístico del Español de España y América (Moreno Fernández, 2021). En el análisis se empleó el sistema LYNEAL (Letras y Números en Análisis Lingüístico) (Ueda, 2021), así como el software estadístico en código abierto R. Los resultados apuntan a que el sexo se revela como una variable importante en el proceso de variación léxica al detectarse, entre otros hallazgos, el uso del estilo nominal sobre el verbal y el empleo preferente de adverbios en -mente por parte del hombre; con respecto a la edad, se advierte la tendencia al empleo del truncamiento léxico en la generación de jóvenes y en el género mujer; por último, se aprecia la concentración de uso de muchísimo en mujer, joven, de nivel primario de instrucción.
Publisher
Universidad Complutense de Madrid (UCM)
Subject
Linguistics and Language,Language and Linguistics
Reference34 articles.
1. Ayuntamiento de Santander. (2020). Plan estratégico Santander 2010-2020. Consultado de http://www.planestrategicosantander.com/documentos.php.
2. Benzècri, Jean Paul (1976). L’Analise des données. II. L’Analyse des correspondences. París: Dubod.
3. Blas Arroyo, José Luis (2005). Sociolingüística del español. Desarrollos y perspectivas en el estudio de la lengua española. Madrid: Cátedra.
4. Cabré, Maria Teresa (1978). La lexicometría como método de localización de rasgos ideológicos. Revista Española de Lingüística 8 (2), 335-344. Consultado https://dialnet.unirioja.es/servlet/articulo?codigo=41045
5. Cestero Mancera, Ana María, Molina Martos, Isabel, Paredes García, Florentino (2006). Estudios sociolingüísticos del español de España y América. Madrid: Arco Libros.