Affiliation:
1. Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия
Abstract
Энкодер в составе языковой модели является механизмом преобразования
текстовой информации в эффективное числовое представление,
пригодное для решения широкого круга задач обработки текста при помощи
нейросетевых методов. В данной статье предложен способ декомпозиции
процесса обучения языкового энкодера. Рассматриваются вопросы
целесообразности такой декомпозиции с точки зрения снижения
вычислительных затрат, контроля качества на промежуточных стадиях
обучения, обеспечения интерпретируемости результатов каждой стадии.
Приводятся оценки качества энкодера.
Publisher
Ailamazyan Program Systems Institute of Russian Academy of Sciences (PSI RAS)