Affiliation:
1. Universidade de Macau, China
Abstract
Resumo O presente artigo apresenta um corpus de aprendizes chineses de português L2 com a anotação de PoS e lema, destacando-se sua potencialidade de análise quantitativa e qualitativa na identificação de padrões linguísticos dos aprendizes, contribuindo, dessa forma, para o ensino de português L2. Este corpus (Corpus de Aprendizes de Português da Universidade de Macau), denominado UMPLC, contém, no total, 933 composições produzidas por 122 estudantes de português da Universidade de Macau durante três anos de estudo consecutivos. A anotação de PoS e lema realizou-se através do Stanza, anotador automático desenvolvido por Qi et al. ( 2020 ). A fim de garantir a consistência de anotação, o resultado foi revisado manualmente. Nesta pesquisa, as informações de PoS e lema permitem-nos investigar quantitativa e qualitativamente diversos fenômenos existentes no corpus relativos ao aspeto lexical e à mudança diacrônica desse aspeto. Dois estudos foram realizados com base em uma abordagem contrastiva, comparando-se o português dos aprendizes do corpus com o português nativo. Foram descobertas características de não-natividade linguística desses aprendizes, o que permitirá que os professores de português L2 se concentrem nas áreas em que é necessário um trabalho corretivo.
Reference24 articles.
1. Analyzing late interlanguage with learner corpora: Québec replications of three european studies;Cobb Tom;The Canadian Modern Language Review,2003
2. A frequency dictionary of Portuguese;Davies Mark,2008
3. Corpus annotation: linguistic information from computer text corpora;Garside Roger,1997
4. Learner English on Computer;Granger Sylviane,1998
5. Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching;Granger Sylviane,2002
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献