УДК 004.891.3:004.032.26
DOI: 10.36871/2618­-9976.2025.11.011

Авторы

Сергей Александрович Ярушев,
Кандидат технических наук, директор центра перспективных исследований в искусственном интеллекте, Российский экономический университет им. Г.В. Плеханова, Москва, Россия
Александр Олегович Ануров,
Лаборант­-исследователь центра перспективных исследований в искусственном интеллекте, Российский экономический университет им. Г.В. Плеханова, Москва, Россия
Геннадий Геннадиевич Булгаков,
Аспирант Российский экономический университет им. Г.В. Плеханова, Москва, Россия

Аннотация

В данной статье рассматриваются основные подходы к интеграции больших языковых моделей (LLM) в системы управления контейнерной оркестрации Kubernetes. Анализируется потенциал LLM для автоматизации операционных задач: генерации YAML-манифестов, оптимизации resource requests/limits, диагностики инцидентов. Предложена трехуровневая архитектура интеллектуального ассистента, включающая интерфейсный слой для natural language processing, слой обработки с RAGмеханизмами обогащения контекста и исполнительный слой взаимодействия с Kubernetes API. Обсуждаются ограничения, связанные с безопасностью (prompt injection, data leakage) и надежностью (hallucinations, API dependencies). Определены перспективные направления: разработка domain-specific моделей, мультимодальный анализ метрик, создание автономных агентов на базе reinforcement learning, а также проведен анализ потенциальных уровней интеграции LLM в оркестратор.

Ключевые слова

Kubernetes
LLM
DevOps automation
container orchestration
AIOps
cloud native
infrastructure as code
RAG

Список литературы

[1] Anthropic. (2024). Claude’s Constitution: Building Safer AI Systems. https://www.anthropic.com/news/claudes­constitution.

[2] Build a RAG chatbot with GKE and Cloud Storage. Technical overview. https://cloud.google.com/kubernetes­engine/docs/tutorials/build­rag­chatbot.

[3] Burns B., Grant B., Oppenheimer D., Brewer E., & Wilkes J. (2016). Borg, Omega, and Kubernetes: Lessons learned from three container­management systems over a decade. ACM Queue, 14(1), 70­93. https://dl.acm.org/doi/10.1145/2898442.2898444.

[4] Brown T., Mann B., Ryder N., et al. (2020). Language Models are Few­Shot Learners. Advances in Neural Information Processing Systems, 33, 1877–1901. https://arxiv.org/abs/2005. 14165.

[5] Chen M., Tworek J., Jun H., et al. (2021). Evaluating Large Language Models Trained on Code. https://arxiv.org/abs/2107.03374.

[6] Cloud Native Computing Foundation. CNCF Annual Survey 2024. https://www.cncf.io/ reports/cncf­annual­survey­2024/.

[7] CNCF Technical Advisory Group. (2023). Cloud Native Glossary. https://glossary.cncf.io/.

[8] DataDog. (2024). Container Report 2024: Kubernetes and Cloud Native Adoption Trends. https://www.datadoghq.com/container­report/.

[9] Feng Z., Guo D., Tang D., et al. (2020). CodeBERT: A Pre­Trained Model for Programming and Natural Languages. Findings of EMNLP 2020. https://arxiv.org/abs/2002.08155.

[10] Gartner. (2023). Market Guide for AIOps Platforms. https://www.gartner.com/en/ documents/4022167.

[11] Google Cloud. (2024). Site Reliability Engineering: How Google Runs Production Systems. https://sre.google/sre­book/table­of­contents/.

[12] Huang Q., et al. (2024). Kubectl­AI: Natural Language Kubernetes Management. Proceedings of the 2024 USENIX Annual Technical Conference. https://www.usenix.org/conference/atc24.

[13] Kubernetes adoption, security, and market trends report 2024 Technical overview https://www.redhat.com/en/resources/kubernetes­adoption­security­market­trendsoverview.

[14] Kubernetes Special Interest Group. (2024). Kubernetes Enhancement Proposals (KEPs). https://github.com/kubernetes/enhancements.

[15] Linux Foundation. (2024). 2024 Cloud Native Survey: Developer Trends Report. https://www.linuxfoundation.org/research/world­of­open­source­2024­developer­trends.

[16] Lewis P., Perez E., Piktus A., et al. (2020). Retrieval­Augmented Generation for KnowledgeIntensive NLP Tasks. Advances in Neural Information Processing Systems, 33. https:// arxiv.org/abs/2005.11401.

[17] Microsoft Azure. (2024). AKS (Azure Kubernetes Service) Best Practices. https://learn. microsoft.com/en­us/azure/aks/best­practices.