Abstract
Автоматический анализ аргументации в текстах привлекает в последние
годы внимание исследователей в связи с широким диапазоном приложений,
в частности, в анализе научных и юридических текстов, новостных статей,
политических дебатов, студенческих эссе и социальных медиа. Новая задача
в этой области— анализ аргументации с учетом аспектов, где под аспектом
понимается свойство объекта, относительно которого строится довод. Учет
аспектов позволяет уточнить направленность аргументации и понимание
аргументационной структуры, а также может быть использован для генерации
высококачественных и специфичных для выбранных аспектов доводов.
В статье предлагается метод классификации аспектов аргументации
в текстах на русском языке, построение на его основе и исследование
моделей классификации аспектов аргументации с использованием машинного
обучения и нейронных сетей. Впервые сформирован русскоязычный текстовый
корпус, включающий 1426 предложений и размеченный по 16 аспектам
аргументации, построена нейросетевая языковая модель классификации
аргументов ArgBERT и обучены модели Random Forest для классификации
аспектов аргументации. Качество классификации на основе Random Forest
составляет в среднем F1=0,6373. Наилучшее качество разработанные модели
демонстрируют для аспектов «Безопасность», «Влияние на здоровье»,
«Влияние на психику», «Отношение властей» и «Уровень жизни» (F1-мера
выше 0,75).
Publisher
Ailamazyan Program Systems Institute of Russian Academy of Sciences (PSI RAS)