УДК 004.032.2
DOI: 10.36871/2618-9976.2024.01.003
Авторы
Виктор Викторович Ерохин,
Московский государственный институт международных отношений (университет) Министерства иностранных дел РФ, МИРЭА – Российский технологический университет, Москва, Россия
Людмила Владимировна Бунина,
МИРЭА – Российский технологический университет, Москва, Россия
Аннотация
Большое внимание в научных публикациях уделяется будущему потенциалу классификации объектов для различных областей деятельности человека. Правильный выбор методов машинного обучения в задачах классификации с большим количеством зашумленных данных является актуальным не только для практического, но и для научного использования. В задачах классификации сочетание анализа изображений и машинного обучения имитирует процесс идентификации объекта(ов) и помогает исследователю эффективно решать прикладные задачи с применением машинного обучения. Но в большинстве задач классификаций имеются неконтролируемые и случайные зашумленные входные данные, которые приводят к сбоям и неточностям при решении таких задач. Следовательно, модель классификации, разработанная на основе узкоспециализированного датасета, скорее всего, будет работать приемлемо с другими подобными датасетами только в том случае, если модель сможет справиться с зашумленностью входных данных. В статье сравнивается производительность модели машинного обучения: нечеткие ассоциативные правила, нечеткие деревья решений, искусственные нейронные сети и логистическая регрессия. Исследуется, как эти модели решают задачи классификации в условиях зашумленных входных данных. Результаты исследования показали, что модели нечетких деревьев решений являются самыми устойчивыми к зашумленным входным данным при решении задач классификации.
Ключевые слова
кластеризация
классификация
искусственная нейронная сеть
моделирование
прогнозирование
нечеткое дерево решений
логистическая регрессия