Author:
Котюрова Ирина Аврамовна,Сафонов Георгий Романович
Abstract
В эпоху цифровизации и активного распространения корпусных технологий в лингвистическом образовании специалисты в области лингводидактики постоянно открывают все новые возможности в работе с большими данными. Одним из относительно новых явлений в российском образовании является сбор корпусов ученических текстов на иностранном языке. Их возможности для лингводидактических исследований зависят прежде всего от продолжительности сбора данных и от разметки, которую содержит тот или иной корпус. В статье речь идет о корпусе немецко-язычных студенческих текстов Петрозаводского аннотированного корпуса текстов и лонгитюдном исследовании типов лингвистических ошибок, допускаемых студентами на всем протяжении изучения немецкого языка в течение 5 лет. Результатом исследования стала статистика по 90 классам ошибок, поделенных на семь основных групп, и динамика этой статистики на протяжении 5 лет обучения немецкому языку. Сравнение наиболее частотных ошибок на первом и пятом курсах показывает, что к темам, которые на протяжении всех годов обучения вызывают наибольшие проблемы у студентов, относятся выбор лексемы, орфография, пропуски, пунктуация и обратный порядок слов. Уходят к концу обучения в вузе проблемы с неопределенным артиклем, склонением прилагательных и существительных, образованием множественного числа и родом существительных, уступая место другим проблемам, таким как лишние элементы, логика, порядок слов в придаточных предложениях и стилистические ошибки.
In the age of digitalization and the active spread of corpus technologies in linguistic education, linguodidactics specialists are constantly discovering new opportunities in working with big data. One relatively new phenomenon in Russian education is the collection of corpora of student texts in a foreign language. It’s possibilities for linguodidactical research depend primarily on the duration of the data collection and on the markup that corpus contains. The article focuses on the corpus of German-language student texts PACT (Petrozavodsk annotated corpus of texts) and longitudinal research of types of linguistic mistakes made by students throughout the study of the German language for 5 years. The result of the research is statistics for 90 classes of errors, divided into 7 major groups – grammar, vocabulary, orthography, punctuation, discourse, omissions and superfluous elements – and the dynamics of these statistics over the 5 years of German language study. Comparison of the most frequent errors made by 1st and 5th year students respectively shows that subjects causing the most problems for students during all years of study are lexeme selection, orthography, omissions in text, punctuation and reverse word order. At the end of study problems with indefinite articles, adjective and noun declension, formation of plural form and gender of nouns are giving way to other issues such as superfluous elements in text, logic, word order in subordinate sentences and stylistic errors.
Publisher
Tomsk State Pedagogical University
Reference17 articles.
1. Трудности и перспективы цифровой трансформации образования / под. ред. А. Ю. Уварова, И. Д. Фрумина. М.: НИУ ВШЭ, 2019. 344 с. DOI: 10.17323/978-5-7598-1990-5
2. Павлова О. Ю. Использование языковых корпусов в обучении иностранному языку // Язык и культура. 2021. № 54. С. 283–298. DOI: 10.17223/19996195/54/16
3. Большие данные в образовании: доказательное развитие образования / под ред. О. А. Фиофановой. М.: Дело. 2021. 342 с.
4. Modeling Language Learning Using Specialized Elo Ratings. Innovative Use of NLP for Building Educational Applications / J. Hou, M. Koppatz, J. M. Hoya Quecedo, N. Stoyanova, M. Kopotev, R. Yangarber; eds. H. Yannakoudakis, E. Kochmar, C. Leacock, N. Madnani, I. Pilán, T. Zesch. Stroudsburg, PA: Association for Computational Linguistics, 2019. P. 494–506. http://dx.doi.org/10.18653/v1/W19-4451
5. Granger S. The International Corpus of Learner English: a new resource for foreign language learning and teaching and second language acquisition research // TESOL Quarterly. 2003. Vol. 37, № 3. P. 538–546.