Abstract
Розроблено метод комплексного аналізу диференціації фоностатистичних структур авторського стилю англійської мови, який ґрунтується на поєднанні трьох статистичних критеріїв: критерію Стьюдента, критерію Колмогорова-Смірнова і критерію хі-квадрат. Поєднання цих критеріїв дає змогу підвищити достовірність диференціації авторських стилів. Для розв'язання задачі диференціації авторських стилів побудовано статистичну модель, яка підвищує достовірність результатів авторської атрибуції тексту. Розроблена програмна система реалізує метод і модель з використанням мови програмування Java, що забезпечує платформонезалежність. Для тестування програми вибрано статті С. Логан і Д. Вебстер з газети "Вільна газета" ("Freedom Paper", papers by S. Logan and D. Webster). Істотні відмінності встановлено за групами носових, дорсальних і велярних фонем за критерієм Стьюдента, за всіма вісьмома групами фонем за критерієм Колмогорова-Смірнова, істотні відмінності встановлено за групами сонорних, щілинних, дорсальних, зімкнених, губних і носових фонем за критерієм хі-квадрат. Поєднання використаних критеріїв дало змогу встановити групу фонем з найбільшою авторорозрізняльною здатністю. Це група дорсальних фонем. За цією групою можна диференціювати тексти різних авторів, що дає змогу змінімізувати кількість груп фонем, за якими здійснюється авторська атрибуція тексту.
Publisher
Ukrainian National Forestry University
Reference18 articles.
1. Altman, H. (2005). Moda ta istyna v linhvistytsi. Problema kvantytatyvnoi linhvistyky. Chernivtsi: Ruta, (pp. 3–11). [In Ukrainian].
2. Altmann, G., Kohler, R., & Piotrowski, R. (2005). Quantitative Linquistik. Ein internationals Handbuch. Berlin, New-York: de Gruyter.
3. Argamon, Sh., Koppel, M., Pennebaker, J., & Schler, J. (2009). Automatically Profiling the Author of an Anonymous Text. Communications of the ACM, 52(2), 119–123. USA.
4. Bisikalo, O. V., & Vysotska, V. A. (2016). Sentence syntactic analysis application to keywords identification ukrainian texts. Radio electronics computer science control, 3(38), 54–65. Zaporizhzhya.
5. Gries, Th. S. (2009). Statistics for Linguistics with R. (Mouton Textbook), 335 p.