УДК 004.93
DOI: 10.36871/2618-­9976.2026.03.014

Авторы

Ирина Сергеевна Кузнецова,
Кандидат физико­-математических наук, доцент кафедры «Математика и информатика», Донской государственный технический университет, Ростов­на­Дону, Россия
Ольга Юрьевна Янова,
Кандидат химических наук, доцент, Казанский государственный энергетический университет, Казань, Россия
Аида Мамаевна Мамаева,
Студент первого курса магистратуры направления «Прикладная математика и информатика» факультета математики и компьютерных наук, Федеральное государственное бюджетное образовательное учреждение высшего образования » Дагестанский государственный университет», Махачкала, Россия

Аннотация

Современные  системы  искусственного  интеллекта  демонстрируют  высокую  эффективность  при  работе  с  большими  размеченными  наборами  данных,  однако  в  ряде  прикладных  задач,  таких  как  медицинская  диагностика,  промышленная инспекция, обработка редких событий и персонализированные  интеллектуальные  сервисы,  доступность  размеченных  данных  крайне  ограничена,  что  делает  традиционные методы  обучения  неэффективными  или  неприемлемыми.  В  связи  с  этим  возрастает  значение  подходов,  способных  обучаться  и  принимать  решения  на  основе  минимального числа примеров или даже без явных примеров целевого класса, что привело к развитию парадигм few­shot и  zero­shot обучения. В статье рассматриваются концептуальные  основы  и  практические  методы  обучения  при  малых  данных,  включая  перенос  обучения  и  использование  предварительно  обученных  моделей,  метаобучение  как  стратегию  «обучения  обучаться»,  генеративные  и  синтетические  подходы для расширения выборки, обучение с самоконтролем и  контрастивные методы, zero­shot подходы на  основе  семантических  описаний  и  больших  языковых  моделей,  а  также практические проблемы и  ограничения, связанные с  устойчивостью  моделей,  доменными  сдвигами,  смещениями и воспроизводимостью.

Ключевые слова

few­-shot learning
zero-­shot learning
метаобучение
перенос обучения
самообучение
предварительно обученные модели
малые данные

Список литературы

[1] Васильев А.В. Искусственный интеллект: методы и технологии. М.: Горячая линия – Телеком, 2019. 352 с.

[2] Гонсалес Р.С., Вудс Р.Э. Цифровая обработка изображений. М.: Техносфера, 2018. 1104 с.

[3] Дьяконов А.Г. Прикладные задачи анализа данных. М.: МЦНМО, 2019. 304 с.

[4] Журавлев Ю.И. Распознавание.  Математические  методы.  Программные  системы. М.: Физматлит, 2016. 352 с.

[5] Зенков А.А. Глубокое обучение и нейронные сети: основы и приложения. М.: ДМК  Пресс, 2021. 512 с.

[6] Кудрявцев Л.Д. Курс математического анализа. М.: Физматлит, 2019. 720 с.

[7] Ляхов А.А. Нейронные сети и глубокое обучение. М.: ДМК Пресс, 2020. 384 с.

[8] Поспелов Д.А. Искусственный интеллект: модели и методы. М.: Наука, 1986. 320 с.

[9] Рашка С., Мирджалили В. Python и машинное обучение. СПб.: Питер, 2020. 848 с.

[10] Румельхарт Д., Хинтон Дж., Уильямс Р. Обучение представлений посредством обратного  распространения  ошибки  //  Нейрокомпьютеры:  разработка  и  применение. 1996. № 1. С. 4–21.

[11] Саймон Х.А. Науки об искусственном. М.: Едиториал УРСС, 2014. 368 с.

[12] Хайкин С. Нейронные сети: полный курс. М.: Вильямс, 2016. 1104 с.

[13] Шапиро Л., Стокман Дж. Компьютерное зрение. М.: Бином, 2016. 752 с.