Affiliation:
1. Казанский (Приволжский) федеральный университет, Казань, Россия
Abstract
Проведена кластеризация рукописных цифр по шестидесяти тысячам
изображений, содержащихся в обучающей выборке базы данных MNIST. Для
кластеризации использована нейронная сеть Кохонена. Для каждой
рукописной цифры определено оптимальное количество кластеров (не более
50). При определении расстояния между объектами (изображениями
рукописных цифр) использована евклидова норма. Проверка правильности
построения кластеров проведена по данным из тестовой выборки базы MNIST.
Тестовая выборка содержит десять тысяч изображений. Сделан вывод о том,
что изображения из тестовой выборки принадлежат кластеру
<<правильной цифры>> с вероятностью более 90%.
Для каждой цифры вычислена F-мера для оценки кластеров. Наилучшие
значения F-меры получены для цифр 0 и 1 (F-среднее значение равно
0,974). Наихудшие значения получены для цифры 9 (F-среднее значение
равно 0,903). Также проведён кластерный анализ, который позволил сделать
выводы о возможных ошибках в распознавании нейронной сетью Кохонена.
Построены пересечения кластеров для изображений рукописных цифр.
Приведены примеры пересечений кластеров, а также показаны примеры
изображений, которые распознаны нейронной сетью неверно.
Publisher
Ailamazyan Program Systems Institute of Russian Academy of Sciences (PSI RAS)
Reference28 articles.
1. D. Latypova. Neural networks using for handwritten numbers recognition, Czech Technical University, Prague, 2020, 77 pp.
2. Handwritten digit recognition of MNIST data using consensus clustering;Rexy;International J. of Recent Technology and Engineering,2019
3. Robust continuous clustering
4. Performance optimization of neural networks in handwritten digit recognition using Intelligent Fuzzy C-Means clustering