УДК 681.3.004.9
DOI: 10.36871/2618­-9976.2025.04.003

Авторы

Андрей Юрьевич Гришин,
Магистрант, Московский физико­-технический институт (национальный исследовательский университет), Долгопрудный, Московская область, Россия; аналитик по машинному обучению, отдел по борьбе с недобросовестным использованием инсайдерской информации и манипулированием рынком Московской биржи, Москва, Россия
Анастасия Валерьевна Шельманова,
Магистрант, Московский государственный университет им. М.В. Ломоносова, Москва, Россия

Аннотация

Целью исследования является разработка адаптивной методологии генерации семантических векторных моделей, обеспечивающих интеграцию многомерных атрибутов объектов в условиях временнóй и структурной гетерогенности данных. Работа является развитием модели глубокого обучения, основанной на архитектуре трансформера, для создания векторных представлений и одновременной кластеризации панельных данных. Часто один объект на временной школе характеризуется внушительным количеством описательных статистических данных, поэтому вполне естественно возникает необходимость представить информацию об объекте в виде числового вектора. Согласно результатам статьи, полученные векторные представления (эмбеддинги) соответствуют набору связанных статистических данных, что дает исследователям возможность изучить общую структуру самих объектов с помощью анализа векторов вместо изучения «прокси-объектов» с помощью полученной статистической информации (описание временной метки: один объект, много векторов – панельные данные).

Ключевые слова

представление последовательности
искусственные нейронные сети
трансформер
позиционное кодирование
панельные данные