Ефективність застосування методів класифікації для задач інтелектуального аналізу великих даних-Reference-Cited by-同舟云学术

Ефективність застосування методів класифікації для задач інтелектуального аналізу великих даних

Published:2024-05-23 Issue:5 Volume:34 Page:119-128
ISSN:2519-2477
Container-title:Scientific Bulletin of UNFU
language:
Short-container-title:SBUNFU

Author:

Петрина В. В.,Дорошенко А. В.^ORCID

Abstract

Проаналізовано ефективність застосування методів класифікації для задач інтелектуального аналізу великих даних на підставі концепції машинного навчання задля підвищення їхньої ефективності у сфері електронної комерції. Проведено порівняльний аналіз застосування таких моделей, як класифікатор методом випадкового лісу (англ. Random Forest), класифікатор методом наївного Байєса (англ. Naïve Bayes) та класифікатор методом опорних векторів (англ. Support Vector Machines, SVM), який також називають опорно-векторними мережами (англ. Support Vector Networks, SVN). Для поширеної у сфері електронної комерції задачі класифікації клієнтів розроблено програмне забезпечення для проведення аналізу відповідних алгоритмів. Проаналізовано вхідні дані і здійснено попередню підготовку даних для навчання та тестування вибраних моделей. Здійснено дослідження обраних моделей із використанням попередньо підготовлених даних за допомогою програмного забезпечення відповідно до визначених сценаріїв. Досліджено параметри обраних моделей класифікації та вдосконалено класифікатор методом випадкового лісу шляхом підбору та зміни параметра випадкового стану. Також впроваджено параметри підтримки ймовірностей у класифікаторі методом опорних векторів. Здійснено із використанням попередньо підготовлених даних дослідження обраних моделей за допомогою програмного забезпечення відповідно до визначених сценаріїв. Впроваджено параметру підтримки ймовірностей у класифікаторі методом опорних векторів. Здійснено порівняння результату точності класифікації обраних моделей класифікації. Згідно з результатами дослідження, визначено позитивний тренд на якість навчання моделей за коректної підготовки даних і впливу підбору коректних параметрів для класифікаторів методами випадкового лісу й опорних векторів. Показники ефективності, точності навчання алгоритму показують позитивну динаміку й порівняно із результатами тестування моделі класифікатора методом наївного Байєса базовими значеннями параметрів моделі. На підставі результатів дослідження підтверджується вплив підбору коректних параметрів залежно від вхідного набору даних на результати точності передбачення алгоритмів і їх вплив на навчання, тренування та тестування моделей машинного навчання. Ці результати свідчать про перспективи до подальшого дослідження щодо розроблення оптимальних стратегій оптимізації та підвищення ефективності щодо роботи з алгоритмами машинного навчання у задачах класифікації.

Publisher

Ukrainian National Forestry University

Reference28 articles.

1. Avcı, C., Budak, M., Yağmur, N., & Balçık, F. (2023). Comparison between random forest and support vector machine algorithms for LULC classification. International Journal of Engineering and Geosciences, 8(1). https://doi.org/10.26833/ijeg.987605

2. Dai, H.-N., Wang, H., Xu, G., Wan, J., Imran, M., Dai, H.-N., & Xu, G. (2019). Big Data Analytics for Manufacturing Internet of Things: Opportunities, Challenges and Enabling Technologies. Enterprise Information Systems, 14. https://doi.org/10.1080/17517575.2019.1633689

3. Deng, R. (2022). Research on value mining of management accounting non-financial data based on association rules algorithm. In: 2022 2nd International Conference on Networking, Communications and Information Technology (NetCIT), Manchester, United Kingdom, 175–178. https://doi.org/10.1109/NetCIT57419.2022.00051

4. H. J. V. L., & Rajan, D. (2023). Enhancing customer experience and sales performance in a retail store using association rule mining and market basket analysis. In: 2023 14th International Conference on Computing Communication and Networking Technologies (ICCCNT), Delhi, India, 1–5. https://doi.org/10.1109/ICCCNT56998.2023.10307411

5. Hammoumi, L., Maanan, M., & Rhinane, H. (2024). Characterizing Smart Cities Based on Artificial Intelligence. Smart Cities, 7(3). https://doi.org/10.3390/smartcities7030056