УДК 004.7, 004.31, 004.942
DOI: 10.36871/2618-9976.2021.02.008

Авторы

Глотов Владимир Иванович
Кандидат экономических наук, профессор, заместитель директора Росфинмониторинга, г. Москва, Россия
Михайлов Дмитрий Михайлович
Кандидат технических наук, высококвалифицированный старший научный сотрудник, ФИАН им. Лебедева РАН, г. Москва, Россия
Юров Алексей Алексеевич
Главный специалист ФИАН им. Лебедева РАН, г. Москва, Россия
Волкова Мария Игоревна
Кандидат экономических наук, Росфинмониторинг, г. Москва, Россия
Пантелеев А.А.
Инженер ФИАН им. П.Н. Лебедева РАН, г. Москва, Россия
Демкин К.В.
Инженер ФИАН им. П.Н. Лебедева РАН, г. Москва, Россия

Аннотация

Статья посвящена сравнению эффективности алгоритмов при обработке больших объемов данных, в частности базы транзакций блокчейна Биткоин, для объединения отдельных адресов по эвристическому признаку «общей траты» одного пользователя. В статье описан разработанный группой алгоритм маркирования вершин. На основе сравнения этого и других алгоритмов предполагается выявить наиболее эффективный алгоритм для проведения кластеризации адресов по признаку принадлежности одному пользователю. База Биткоин содержит в себе сведения о миллионах финансовых транзакций этой уникальной системы. Несмотря на то, что информация о транзакциях анонимна, существует ряд методов объединения адресов пользователей в кошельки. В данной статье проводится исследование алгоритмов поиска компонент связности, на которых основан один из методов объединения кошельков по эвристическому признаку «общей траты» одного пользователя. Сделан упор на практические аспекты реализации – аппаратные ограничения при обработке больших массивов данных, а также выбор решения для большого количества компонент связности графа – максимальное по включению связное множество вершин графа, иными словами совокупности непустого множества вершин и множества пар вершин.

Ключевые слова

Биткоин
Криптовалюта
Блокчейн
Теория графов
Алгоритм связности компонент
Алгоритм Шилоха–Вишкина