УДК 330.322:004.8:004.75
DOI: 10.36871/ek.up.p.r.2026.03.08.020
Авторы
Валерий Алексеевич Батурин,
Марат Тимурович Хаков,
Григорий Евгеньевич Калентьев,
Газинур Талгатович Нуртдинов,
Уфимский университет науки и технологий, Уфа, Россия
Аннотация
В статье рассматривается экономическая целесообразность размещения малых моделей искусственного интеллекта (ИИ) непосредственно на пользовательских и промышленных устройствах (on-device) в сопоставлении с использованием облачных сервисов ИИ. Актуальность темы обусловлена одновременным ростом спроса на ИИ-функции в массовых продуктах и усилением ограничений, связанных с сетевой латентностью, конфиденциальностью данных и совокупными издержками эксплуатации. На основе систематизации рецензируемой литературы и нормативных документов по облачным и периферийным вычислениям предложена сравнительная рамка, объединяющая совокупную стоимость владения (Total Cost of Ownership, TCO), структуру CAPEX/OPEX, транзакционные издержки внедрения и сопровождения, а также требования к безопасности данных. Показано, что локальные малые модели обладают потенциалом снижения переменных издержек на обработку запросов и издержек передачи данных при высокой частоте использования и строгих требованиях к автономности и задержкам, однако формируют новые статьи затрат, связанные с аппаратной базой, управлением версиями и безопасным обновлением на множестве конечных устройств. Облачные сервисы, напротив, уменьшают капитальные затраты и барьеры масштабирования, но увеличивают зависимость от сетевой инфраструктуры и провайдеров, а также могут усиливать издержки комплаенса и контроля данных. Научная новизна заключается в формализации экономических критериев выбора архитектуры «устройство-облако» для ИИ с учетом технологических ограничений малых моделей и институциональных требований безопасности. Практическая значимость связана с применением предложенной рамки в инвестиционном обосновании ИИ-проектов и в разработке гибридных архитектур, минимизирующих стоимость владения при заданных требованиях к качеству и рискам.
Ключевые слова
локальные модели, малые модели, on-device, облачные вычисления, совокупная стоимость владения, CAPEX, OPEX, периферийные вычисления, безопасность данных
Список литературы
- Mell P., Grance T. The NIST Definition of Cloud Computing: NIST Special Publication 800-145. Gaithersburg, MD: National Institute of Standards and Technology, 2011. 7 p. DOI: 10.6028/NIST. SP.800-145. URL: https://nvlpubs.nist.gov/ nistpubs/legacy/sp/nistspecialpublication800-145. pdf (дата обращения: 25.02.2026).
- Satyanarayanan M. The Emergence of Edge Computing // Computer. 2017. Vol. 50, No. 1. P. 30–39. DOI: 10.1109/MC.2017.9. URL: https:// elijah.cs.cmu.edu/DOCS/satya-edge2016.pdf (дата обращения: 25.02.2026).
- Wang X., Tang Z., Guo J., Meng T., Wang C., Wang T., Jia W. Empowering Edge Intelligence: A Comprehensive Survey on On-Device AI Models // ACM Computing Surveys. 2025. Vol. 57, No. 9. P. 1–39. DOI: 10.1145/3724420. URL: https:// doi.org/10.1145/3724420 (дата обращения: 25.02.2026).
- Зацаринная Е. И., Маркова Е. В., Крымшоколова А. А. Влияние облачных вычислений на структуру затрат предприятий: переход от CAPEX к OPEX // Экономика и управление: проблемы, решения. 2025. Т. 8. № 5. URL: https://s-lib.com/issues/eiu_2025_05_v8_a4/ (дата обращения: 25.02.2026).
- Максимов К. В. Эффективность использования облачных вычислений: методы и модели оценки // Прикладная информатика. 2016. Т. 11. № 1 (64). С. 106–113. URL: https://cyberleninka.ru/ article/n/effektivnost-ispolzovaniya-oblachnyhvychisleniy-metody-i-modeli-otsenki.pdf (дата обращения: 25.02.2026).
- Цветков А. В. Моделирование совокупной стоимости владения различных вариантов построения ИТ-инфраструктуры банка // Транспортное дело России. 2015. № 3. С. 71–72. URL: https://cyberleninka.ru/article/n/modelirovaniesovokupnoy-stoimosti-vladeniya-razlichnyhvariantov-postroeniya-it-infrastruktury-banka. pdf (дата обращения: 25.02.2026).
- Якушева Н. А. Расчет экономической эффективности облачных вычислений // Инженерный журнал: наука и инновации. 2012. URL: https://engjournal.bmstu.ru/catalog/it/hidden/124. html (дата обращения: 25.02.2026).
- Смелянский Р. Л. Иерархические периферийные вычисления // Моделирование и анализ информационных систем. 2019. Т. 26. № 1. С. 146–169. DOI: 10.18255/1818-1015-2019-1-146- 169. URL: https://doi.org/10.18255/1818-1015- 2019-1-146-169 (дата обращения: 25.02.2026).
- Nikolaou P., Sazeides Y., Lampropulos A., Guilhot D., Bartoli A., Papadimitriou G. et al. Total Cost of Ownership Perspective of Cloud vs Edge Deployments of IoT Applications // Computing at the EDGE: New Challenges for Service Provision / ed. G. Karakonstantis, C. J. Gillan. Cham: Springer, 2022. P. 141–161. DOI: 10.1007/978- 3-030-74536-3. URL: https://link.springer.com/ book/10.1007/978-3-030-74536-3 (дата обращения: 25.02.2026).
- Cao L. et al. Cost optimization in edge computing: a survey // Artificial Intelligence Review. 2024. DOI: 10.1007/s10462-024-10947-4. URL: https:// link.springer.com/article/10.1007/s10462-024- 10947-4 (дата обращения: 25.02.2026).
- Bhushan C. M., Koppuravuri P., Prasanthi N. et al. Deploying TinyML for energy-efficient object detection and communication in low-power edge AI systems // Scientific Reports. 2025. Vol. 15. Art. 44299. DOI: 10.1038/s41598-025-27818-9. URL: https://www.nature.com/articles/s41598- 025-27818-9 (дата обращения: 25.02.2026).
- Международный союз электросвязи. Рекомендация МСЭ-Т X.1648 (04/2025). Руководящие указания по обеспечению безопасности данных периферийных вычислений. Женева: ITU, 2025. URL: https://www.itu.int/rec/TREC-X.1648-202504-I/ru (дата обращения: 25.02.2026).

