УДК 330.4
DOI: 10.36871/ek.up.p.r.2025.06.08.020

Авторы

Камиль Ильясович Шигапов,
Казанский национальный исследовательский технический университет имени А. Н. Туполева, Казань, Россия
Зарина Мухмадовна Лорсанова,
Чеченский государственный университет имени А. А. Кадырова, Грозный, Россия
Анна Алексеевна Ильмушкина,
Российский биотехнологический университет (РОСБИОТЕХ), Москва, Россия

Аннотация

В статье рассмотрены современные методы синтетического снабжения данных, применяемые для обучения моделей машинного обучения в условиях дефицита выборок, характерного для экономических исследований и практики. Проанализированы основные подходы к генерации искусственных данных, включая методы на основе статистических моделей, вариационных автоэнкодеров и генеративно-состязательных сетей. Особое внимание уделено оценке качества синтетических данных и их влиянию на точность и устойчивость экономических моделей. Обоснована необходимость применения синтетических данных для повышения репрезентативности обучающих выборок, снижения риска переобучения и обеспечения конфиденциальности исходных данных. Предложены рекомендации по интеграции синтетических данных в экономические аналитические процессы с учетом особенностей экономической информации и требований к её достоверности.

Ключевые слова

синтетические данные, машинное обучение, дефицит выборок, экономическое моделирование, генерация данных, качество данных