Автоматизація прискореної обробки медіа контенту для виявлення ризикової інформації

Author:

Кмитюк Т. Л.ORCID,Завальський А. А.ORCID

Abstract

Актуальність теми дослідження зумовлена зростанням обсягу медіа контенту та необхідністю ефективного виявлення ризикової інформації, що може мати негативні наслідки для суспільства та бізнесу. Важливість автоматизації цього процесу підкреслюється складністю та великим обсягом даних, які потребують аналізу. Метою дослідження є розробка візуального користувацького інтерфейсу (UI додатку) для автоматизації прискореної обробки медіа контенту з використанням методів машинного та глибокого навчання для виявлення ризикової інформації. Дизайн дослідження включає збір та підготовку даних, вибір та навчання моделей машинного та глибокого навчання, оцінку та тестування моделей, а також їх впровадження в реальні умови. Використовується підхід, який поєднує машинне навчання з алгоритмами обробки природної мови для аналізу тексту та візуального контенту. Основна гіпотеза дослідження полягає в тому, що методи машинного та глибокого навчання можуть значно покращити ефективність та точність виявлення ризикової інформації у медіа контенті. Нові дані включають результати тестування моделей на реальних наборах даних. Методика дослідження включає збір даних, їх очищення та анотацію, навчання моделей машинного та глибокого навчання, а також оцінку їх продуктивності за допомогою метрик точності, відтворюваності та специфічності. У дослідженні виявлено, що побудований додаток значно покращує точність та швидкість виявлення ризикової інформації. Наведено результати тестування, які демонструють високу ефективність моделей у реальних умовах. Теоретичне значення дослідження полягає у розвитку методології автоматизації обробки україномовного медіа контенту, що може бути використана для подальших досліджень у цій сфері. Практичне значення дослідження полягає у можливості застосування додатку для покращення моніторингу та аналізу медіа контенту у різних галузях, а також для імплементації або вдосконалення реальних програмних продуктів. Тип статті – емпіричний.

Publisher

NGO "Research and Educational Innovation Center of Social Transformations"

Reference10 articles.

1. Site of Pew Research Center. pewresearch.org. Retrieved from https://www.pewresearch.org

2. Crider, A. (2021, 16 April). Scrape Web Articles With Python. Medium. Retrieved from https://medium.com/geekculture/automating-web-scraping-articles-with-python-49dce6714517

3. Ajala, E. (2018, 21 August). What is Web Scraping? Imperva a Thales company. Retrieved from https://www.imperva.com/blog/archive/the-economics-of-web-scraping-report/

4. Haisal, A. D., & Mahmood, U. (2022). Sentiment Classification: Review of Text Vectorization Methods: Bag of Words, Tf-Idf, Word2vec and Doc2vec. SLU Journal of Science and Technology, 4. 27-33. Doi: http://doi.org/10.56471/slujst.v4i.266.

5. Kmytiuk, T. L., & Zavalskyi, A. A. (2024). Analiz modelei hlybokoho ta mashynnoho navchannia dlia roboty z pryrodnoiu movoiu [Analysis of deep and machine learning models for working with natural language]. Efektyvna ekonomika - Effective Economics, 2. Doi: http://doi.org/10.32702/2307-2105.2024.2.80 [in Ukrainian]

同舟云学术

1.学者识别学者识别

2.学术分析学术分析

3.人才评估人才评估

"同舟云学术"是以全球学者为主线,采集、加工和组织学术论文而形成的新型学术文献查询和分析系统,可以对全球学者进行文献检索和人才价值评估。用户可以通过关注某些学科领域的顶尖人物而持续追踪该领域的学科进展和研究前沿。经过近期的数据扩容,当前同舟云学术共收录了国内外主流学术期刊6万余种,收集的期刊论文及会议论文总量共计约1.5亿篇,并以每天添加12000余篇中外论文的速度递增。我们也可以为用户提供个性化、定制化的学者数据。欢迎来电咨询!咨询电话:010-8811{复制后删除}0370

www.globalauthorid.com

TOP

Copyright © 2019-2024 北京同舟云网络信息技术有限公司
京公网安备11010802033243号  京ICP备18003416号-3