Longitudinal studies of language errors based on a German-language learner corpus

Author:

Котюрова Ирина Аврамовна,Сафонов Георгий Романович

Abstract

В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки. In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.

Publisher

Tomsk State Pedagogical University

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线,采集、加工和组织学术论文而形成的新型学术文献查询和分析系统,可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容,当前同舟云学术共收录了国内外主流学术期刊6万余种,收集的期刊论文及会议论文总量共计约1.5亿篇,并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询!咨询电话:010-8811{复制后删除}0370

www.globalauthorid.com

TOP

Copyright © 2019-2024 北京同舟云网络信息技术有限公司
京公网安备11010802033243号  京ICP备18003416号-3