УДК 004.8:004.9
DOI: 10.36871/2618-9976.2025.12–2.011
Авторы
Екатерина Михайловна Бесфамильная,
Доцент кафедры «Информатика и вычислительная техника пищевых производств», Федеральное государственное бюджетное образовательное учреждение высшего образования «Российский биотехнологический университет (РОСБИОТЕХ)», г. Москва, Россия
Антон Валерьевич Смирнов,
Старший преподаватель кафедры «Естественнонаучных и технических дисциплин», Московский государственный университет технологий и управления имени К. Г. Разумовского (Первый казачий университет), г. Димитровград, Россия
Осман Мовладинович Минаев,
Старший преподаватель кафедры «Программирование и инфокоммуникационные технологии», ФГБОУ ВО «Чеченский государственный университет им. А. А. Кадырова», г. Грозный, Россия
Аннотация
В статье рассматривается задача контекстно-зависимой маршрутизации запросов к большим языковым моделям в гибридных кластерах как многокритериальная задача управления вычислительными ресурсами под бюджетными и сервисными ограничениями. Предлагается формальный аппарат, в котором семантическая нагрузка запроса, его вычислительная сложность и требования к задержке интегрируются в функцию качества, а временные, денежные и энергетические издержки описываются единой функцией стоимости, задающей пространство допустимых стратегий выбора пары «модель–вычислительный домен». Показано, что пороговые эвристики, статистически обучаемые маршрутизаторы и архитектуры с условным вычислением, включая структуры типа «смесь экспертов», могут быть приведены к общему вариационному шаблону контекстно-зависимого распределения вычислений.
Ключевые слова
большие языковые модели
контекстно-зависимая маршрутизация
управление вычислительными
затратами
Список литературы
[1] Антипов И. С. Интеллектуальный метод фаззинг-тестирования программного обеспечения авиационных информационных систем в рамках цикла безопасной разработки ПО // Системы и технологии информационных наук.—2025.—№ 1.—С. 31–36.
[2] Володина Д. В., Юрьева Ю. С. Возможности использования больших языковых моделей при выполнении перевода студентами технического вуза // Вестник Омского государственного педагогического университета. Гуманитарные исследования. — 2025.—№ 1 (46).—С. 139–144.
[3] Девяткин Д. А., Салимовский В. А., Чудова Н. В. и др. Большие языковые модели и жанрово-речевая системность // Жанры речи. — 2025. — Т. 20, вып. 1 (45). — С. 6–23.
[4] Конев А. А., Паюсова Т. И. Большие языковые модели в информационной безопасности и тестировании на проникновение: систематический обзор возможностей применения // Научно-технический вестник информационных технологий, механики и оптики.—2025.—Т. 25, № 1.—С. 42–52.
[5] Кричевский М. Л. Большие языковые модели при решении педагогических задач // Образовательные ресурсы и технологии.—2025.—№ 2 (51).—С. 102–111.
[6] Назаров Д. М., Бегичева С. В., Копнин А. А. Большие языковые модели (LLM): новый этап цифровой трансформации агропромышленного комплекса России // Аграрный вестник Урала.—2025.—Т. 25, № 7.—С. 1129–1142.
[7] Орлов С. В. К вопросу о генезисе представлений о формировании информационного общества // Информационное общество.—2025.—№ 1.—С. 10–23.
[8] Подобных А. В. Страхование рисков в криптосфере: защита цифровых активов и обеспечение безопасности // Информационная безопасность.—2023.—№ 2.—С. 48–49.
[9] Семерня А. С. Развитие и применение больших языковых моделей // Россия молодая: материалы XVII Всероссийской научно-практической конференции молодых учёных.—2025.—С. 1–3.
[10] Федотова А. М., Романов А. С. Методика идентификации текстов, сгенерированных большими языковыми моделями // Информатика и автоматизация (Труды СПИИРАН).—2025.—Т. 24, № 5.—С. 7–20.

