УДК 004.82
DOI: 10.36871/26189976.2026.04-2.005

Авторы

Александр Олегович Ануров,
Российский экономический университет им. Г.В. Плеханова, Москва, Россия
Геннадий Геннадьевич Булгаков,
Российский экономический университет им. Г.В. Плеханова, Москва, Россия
Иван Николаевич Петров,
Российский экономический университет им. Г.В. Плеханова, Москва, Россия
Сергей Александрович Ярушев,
Российский экономический университет им. Г.В. Плеханова, Москва, Россия

Аннотация

В работе рассматривается концепция семантической репликации данных в геораспределённых системах, при которой между регионами распространяются не все изменения состояния, а только семантически релевантные фрагменты данных. В отличие от классических подходов (репликация по ключу, партиционирование, rule-based selective replication), предлагается использовать методы семантического представления (векторные эмбеддинги, LLM-оценку релевантности, семантическое тегирование) как механизм принятия решений о репликации на уровне потока событий или изменений (лог/CDC). Вводится понятие semantic eventual consistency — модель согласованности, в которой реплики стремятся к состоянию, достаточному относительно семантического профиля региона, а не к полной идентичности данных во всех копиях. Обсуждаются ключевые trade-off’ы между задержкой, стоимостью межрегионального обмена и семантической полнотой, а также архитектурные паттерны реализации (semantic routing, hybrid digest + on-demand fetch) и риски (недетерминизм, дрейф моделей, ошибки фильтрации, вопросы безопасности и локализации данных). Работа носит обзорно-концептуальный характер и формулирует терминологию и направления дальнейших исследований семантически-ориентированных механизмов репликации.

Ключевые слова

геораспределённые системы,
репликация, выборочная репликация,
семантическая репликация, LLM,
эмбеддинги, согласованность, eventual consistency, семантическая
согласованность, edge computing.

Список литературы

[1] Abadi D. Consistency tradeoffs in modern distributed database system design: CAP is only part of the story // Computer. 2012. Vol. 45, № 2. P. 37–42. https://doi.org/10.1109/ MC.2011.389.

[2] Corbett J. C., Dean J., Epstein M., Fikes A., Frost C., Furman J. J., Ghemawat S., Gubarev A., Heiser C., Hochschild P., Hsieh W., Kanthak S., Kogan E., Li H., Lloyd A., Melnik S., Mwaura D., Nagle D., Quinlan S., Rao R., Rolig L., Saito Y., Szymaniak M., Taylor C., Wang R., Woodford D. Spanner: Google’s globally distributed database // ACM Transactions on Computer Systems. 2013. Vol. 31, № 3. Art. 8. 22 p. https://doi.org/10.1145/2491245.

[3] Gilbert S., Lynch N. Brewer’s conjecture and the feasibility of consistent, available, partitiontolerant web services // ACM SIGACT News. 2002. Vol. 33, № 2. P. 51–59. https://doi. org/10.1145/564585.564601.

[4] Kreps J., Narkhede N., Rao J. Kafka: a distributed messaging system for log processing // Proc. NetDB Workshop at SIGMOD. 2011. 6 p.

[5] Lewis P., Perez E., Piktus A., Petroni F., Karpukhin V., Goyal N., Küttler H., Lewis M., Yih W.-t., Rocktäschel T., Riedel S., Kiela D. Retrieval-augmented generation for knowledge-intensive NLP tasks // Advances in Neural Information Processing Systems. 2020. Vol. 33. P. 9459– 9474.

[6] Reimers N., Gurevych I. Sentence-BERT: Sentence embeddings using Siamese BERT-networks // Proc. Conf. on Empirical Methods in Natural Language Processing and 9th Int. Joint Conf. on Natural Language Processing (EMNLP-IJCNLP). Hong Kong, China, 2019. P. 3982–3992.

[7] Satyanarayanan M. The emergence of edge computing // Computer. 2017. Vol. 50, № 1. P. 30–39. https://doi.org/10.1109/MC.2016.355.

[8] Shapiro M., Preguiça N., Baquero C., Zawirski M. Conflict-free replicated data types // Proc. 13th Int. Symp. on Stabilization, Safety, and Security of Distributed Systems (SSS). Berlin: Springer, 2011. Vol. 6976. P. 386–400. https://doi.org/10.1007/978–3–642–24550–3_29.

[9] Vogels W. Eventually consistent // Communications of the ACM. 2009. Vol. 52, № 1. P. 40–44. https://doi.org/10.1145/1435417.1435432.

[10] Zheng L., Chiang W.-L., Sheng Y., Zhuang S., Wu Z., Zhuang Y., Lin Z., Li Z., Li D., Xing E., Zhang H., Gonzalez J. E., Stoica I. Judging LLM-as-a-judge with MT-bench and chatbot arena // Advances in Neural Information Processing Systems. 2023. Vol. 36. https://arxiv.org/abs/2306.05685.