УДК: 330.34:004.8
DOI: 10.36871/ek.up.p.r.2026.03.08.019
Авторы
Марат Тимурович Хаков,
Газинур Талгатович Нуртдинов,
Григорий Евгеньевич Калентьев,
Валерий Алексеевич Батурин,
Уфимский университет науки и технологий, Уфа, Россия
Аннотация
Синтетические данные (СД) рассматриваются как производный экономический ресурс, способный снижать барьеры доступа к данным и ускорять разработку решений на основе искусственного интеллекта (ИИ). Вместе с тем их создание требует специфических инвестиций и формирует новые контуры модельных и операционных рисков. Цель исследования – разработать прикладную рамку экономической оценки СД, сопоставляющую затраты на генерацию, выигрыш в доступности данных и рост модельных рисков. Методологическая база включает аналитический обзор подходов к измерению данных как актива, систематизацию научной литературы по методам генерации и оценке полезности СД, а также сопоставление практик управления рисками ИИ в международных стандартах и руководствах. В результате предложена матрица «затраты–выигрыши–риски» по жизненному циклу СД, выделены ключевые драйверы полной стоимости владения синтетическим набором и определены условия, при которых выигрыш в доступности данных не компенсируется падением полезности и ростом рисков. Научная новизна заключается в интеграции стоимостного и риск-ориентированного анализа СД как ресурса цифровой экономики. Практическая значимость связана с возможностью применения предложенной рамки при проектировании корпоративной политики данных, бюджетировании проектов ИИ и выборе режимов распространения данных.
Ключевые слова
синтетические данные, экономика данных, доступ к данным, стоимость генерации, полезность данных, приватность, модельный риск, управление рисками ИИ, генеративные модели
Список литературы
- Corrado C., Haskel J., Iommi M., Jona‑Lasinio C. Measuring data as an asset: Framework, methods and preliminary estimates // OECD Economics Department Working Papers. 2022. No. 1731. DOI: 10.1787/b840fb01-en. URL: https://www. oecd.org/content/dam/oecd/en/publications/ reports/2022/11/measuring-data-as-an-asset_ cf2c5025/b840fb01-en.pdf (дата обращения: 25.02.2026).
- Моторин О.А., Гринько В.С., Кузьмин В.Н. Разработка концептов экономики данных как новой парадигмы цифровой хозяйственной деятельности // Экономика и управление: проблемы, решения. 2025. Т. 5. № 10. С. 173–179. DOI: 10.36871/ek.up.p.r.2026.03.08.. URL: https://s-lib.com/issues/eiu_2025_10_v5_a21/ (дата обращения: 25.02.2026).
- Raghunathan T.E. Synthetic Data // Annual Review of Statistics and Its Application. 2021. Vol. 8. P. 129–140. DOI: 10.1146/annurevstatistics-040720-031848. URL: https://www. annualreviews.org/content/journals/10.1146/ annurev-statistics-040720-031848?crawler=true &mimetype=application%2Fpdf (дата обращения: 25.02.2026).
- Rubin D.B. Discussion: Statistical Disclosure Limitation // Journal of Official Statistics. 1993. Vol. 9. No. 2. P. 461–468. URL: https://www.scb. se/contentassets/ca21efb41fee47d293bbee5bf7be 7fb3/discussion-statistical-disclosure-limitation2. pdf (дата обращения: 25.02.2026).
- OECD. Enhancing Access to and Sharing of Data: Reconciling Risks and Benefits for Data Re‑use across Societies. Report. Paris: OECD Publishing, 2019. URL: https://www. oecd.org/content/dam/oecd/en/publications/ reports/2019/11/enhancing-access-to-and-sharingof-data_070835df/276aaca8-en.pdf (дата обращения: 25.02.2026).
- National Institute of Standards and Technology. Artificial Intelligence Risk Management Framework (AI RMF 1.0). NIST AI 100‑1. 2023. URL: https://nvlpubs.nist.gov/nistpubs/ai/nist. ai.100-1.pdf (дата обращения: 25.02.2026).
- ISO/IEC. ISO/IEC 23894:2023 Information technology – Artificial intelligence – Guidance on risk management. Standard. 2023. URL: https:// www.iso.org/standard/77304.html (дата обращения: 25.02.2026).
- Lautrup A.D., Hyrup T., Zimek A., Schneider‑Kamp P. Systematic Review of Generative Modelling Tools and Utility Metrics for Fully Synthetic Tabular Data // ACM Computing Surveys. 2025. Vol. 57. No. 4. Article 90. DOI: 10.1145/3704437. URL: https://dl.acm. org/doi/10.1145/3704437 (дата обращения: 25.02.2026).
- Hu J., Bowen C.M. Advancing microdata privacy protection: A review of synthetic data methods // WIREs Computational Statistics. 2024. Vol. 16. Issue 1. e1636. DOI: 10.1002/wics.1636. URL: https://wires.onlinelibrary.wiley.com/ doi/abs/10.1002/wics.1636 (дата обращения: 25.02.2026).
- Eigenschink P., Reutterer T., Vamosi S., Vamosi R., Sun C., Kalcher K. Deep Generative Models for Synthetic Data: A Survey // IEEE Access. 2023. Vol. 11. P. 47304–47320. DOI: 10.1109/ ACCESS.2023.3275134. URL: https://doi. org/10.1109/ACCESS.2023.3275134 (дата обращения: 25.02.2026).
- Fonseca J., Bacao F. Tabular and latent space synthetic data generation: a literature review // Journal of Big Data. 2023. Vol. 10. Article 115. P. 1–37. DOI: 10.1186/s40537-023-00792-7. URL: https://doi.org/10.1186/s40537-023-00792-7 (дата обращения: 25.02.2026).
- Nowok B., Raab G.M., Dibben C. synthpop: Bespoke Creation of Synthetic Data in R // Journal of Statistical Software. 2016. Vol. 74. No. 11. P. 1–26. DOI: 10.18637/jss.v074.i11. URL: https:// www.jstatsoft.org/article/view/v074i11 (дата обращения: 25.02.2026).
- Xu L., Skoularidou M., Cuesta‑Infante A., Veeramachaneni K. Modeling Tabular Data using Conditional GAN // Advances in Neural Information Processing Systems (NeurIPS). 2019. URL: https://proceedings.neurips.cc/paper_files/ paper/2019/file/254ed7d2de3b23ab10936522dd5 47b78-Paper.pdf (дата обращения: 25.02.2026).
- van Breugel B., Tyagi H., Riva G. et al. Membership Inference Attacks against Synthetic Data through Overfitting Detection // Proceedings of Machine Learning Research. 2023. Vol. 206. P. 5654–5670. URL: https://proceedings.mlr. press/v206/breugel23a.html (дата обращения: 25.02.2026).
- Пчелинцев С., Юляшков М.А., Ковалева О.А. Метод создания синтетических наборов данных для обучения нейросетевых моделей распознаванию объектов // Информационно‑управляющие системы. 2022. № 3 (118). С. 9–19. DOI: 10.31799/1684-8853-2022-3-9-19. URL: https://doi.org/10.31799/1684-8853-2022-3-9-19 (дата обращения: 25.02.2026).
- Салова Т.Л., Суворов И.С. Синтетические данные: проблемы и пути их решения // Математические структуры и моделирование. 2025. № 3 (75). С. 116–121. DOI: 10.24147/2222- 8772.2025.3.116-121. URL: https://msm.omsu. ru/jrns/jrn75/salova.pdf (дата обращения: 25.02.2026).
- Зеленков Ю.А., Лашкевич Е.В. Контрфактуальные объяснения на основе генерации синтетических данных // Бизнес‑информатика. 2024. Т. 18. № 3. С. 24–40. DOI: 10.17323/2587- 814X.2024.3.24.40. URL: https://bijournal.hse.ru/ article/download/25895/21356/ (дата обращения: 25.02.2026).

