УДК 004.93
DOI: 10.36871/2618-9976.2026.03.014
Авторы
Ирина Сергеевна Кузнецова,
Кандидат физико-математических наук, доцент кафедры «Математика и информатика», Донской государственный технический университет, РостовнаДону, Россия
Ольга Юрьевна Янова,
Кандидат химических наук, доцент, Казанский государственный энергетический университет, Казань, Россия
Аида Мамаевна Мамаева,
Студент первого курса магистратуры направления «Прикладная математика и информатика» факультета математики и компьютерных наук, Федеральное государственное бюджетное образовательное учреждение высшего образования » Дагестанский государственный университет», Махачкала, Россия
Аннотация
Современные системы искусственного интеллекта демонстрируют высокую эффективность при работе с большими размеченными наборами данных, однако в ряде прикладных задач, таких как медицинская диагностика, промышленная инспекция, обработка редких событий и персонализированные интеллектуальные сервисы, доступность размеченных данных крайне ограничена, что делает традиционные методы обучения неэффективными или неприемлемыми. В связи с этим возрастает значение подходов, способных обучаться и принимать решения на основе минимального числа примеров или даже без явных примеров целевого класса, что привело к развитию парадигм fewshot и zeroshot обучения. В статье рассматриваются концептуальные основы и практические методы обучения при малых данных, включая перенос обучения и использование предварительно обученных моделей, метаобучение как стратегию «обучения обучаться», генеративные и синтетические подходы для расширения выборки, обучение с самоконтролем и контрастивные методы, zeroshot подходы на основе семантических описаний и больших языковых моделей, а также практические проблемы и ограничения, связанные с устойчивостью моделей, доменными сдвигами, смещениями и воспроизводимостью.
Ключевые слова
few-shot learning
zero-shot learning
метаобучение
перенос обучения
самообучение
предварительно обученные модели
малые данные
Список литературы
[1] Васильев А.В. Искусственный интеллект: методы и технологии. М.: Горячая линия – Телеком, 2019. 352 с.
[2] Гонсалес Р.С., Вудс Р.Э. Цифровая обработка изображений. М.: Техносфера, 2018. 1104 с.
[3] Дьяконов А.Г. Прикладные задачи анализа данных. М.: МЦНМО, 2019. 304 с.
[4] Журавлев Ю.И. Распознавание. Математические методы. Программные системы. М.: Физматлит, 2016. 352 с.
[5] Зенков А.А. Глубокое обучение и нейронные сети: основы и приложения. М.: ДМК Пресс, 2021. 512 с.
[6] Кудрявцев Л.Д. Курс математического анализа. М.: Физматлит, 2019. 720 с.
[7] Ляхов А.А. Нейронные сети и глубокое обучение. М.: ДМК Пресс, 2020. 384 с.
[8] Поспелов Д.А. Искусственный интеллект: модели и методы. М.: Наука, 1986. 320 с.
[9] Рашка С., Мирджалили В. Python и машинное обучение. СПб.: Питер, 2020. 848 с.
[10] Румельхарт Д., Хинтон Дж., Уильямс Р. Обучение представлений посредством обратного распространения ошибки // Нейрокомпьютеры: разработка и применение. 1996. № 1. С. 4–21.
[11] Саймон Х.А. Науки об искусственном. М.: Едиториал УРСС, 2014. 368 с.
[12] Хайкин С. Нейронные сети: полный курс. М.: Вильямс, 2016. 1104 с.
[13] Шапиро Л., Стокман Дж. Компьютерное зрение. М.: Бином, 2016. 752 с.

