Abstract
A correção automática de redações é um problema que vem sendo bastante explorado nos últimos anos. Um dos aspectos mais desafiadores nessa tarefa é avaliação do nível de domínio do aluno quanto aos mais variados tipos de estruturas textuais. A estrutura narrativa é um caso especialmente complexo devido ao seu caráter extremamente subjetivo. Trabalhos anteriores na área de correção textual, não abordaram o problema de automatizar a avaliação do nível de competência do aluno na escrita de narrativas. Este trabalho investiga o uso de algoritmos de aprendizagem de máquina para a detecção de clímax em redações em Português como um passo inicial na resolução do problema de correção automática de textos narrativos. Três algoritmos de classificação tradicionais, o support vector machine, floresta aleatória e descida de gradiente estocástica, foram aplicados em um conjunto de dados anotado traduzido para o Português. Os algoritmos foram avaliados em termos de precisão, revocação e pontuação F1, sendo a floresta aleatória o algoritmo de melhor desempenho. Além disso, foi realizado uma análise dos atributos envolvidos, e os experimentos mostraram que os melhores resultados são obtidos ao combinar-se atributos tanto do Coh-Metrix quanto do LIWC.
Publisher
Sociedade Brasileira de Computação - SBC
Cited by
1 articles.
订阅此论文施引文献
订阅此论文施引文献,注册后可以免费订阅5篇论文的施引文献,订阅后可以查看论文全部施引文献