УДК 004.891.2
DOI: 10.36871/2618-9976.2024.03.006

Авторы

Дмитрий Григорьевич Родионов,
Доктор экономических наук, профессор, Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Евгений Александрович Конников,
Кандидат экономических наук, Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Полина Александровна Пашинина,
Специалист, Санкт-Петербургский государственный экономический университет, Санкт-Петербург, Россия
Сергей Иванович Шаныгин,
Доктор экономических наук, профессор, Санкт-Петербургский государственный университет, Санкт-Петербург, Россия

Аннотация

В статье исследовано влияние обработки текстов, тематического моделирования и машинного обучения на прогнозирование динамики цен на акции компаний в информационной среде. Выявлено, что использование таких методов, как TF-IDF и LDA, позволяет определить ключевые темы, влияющие на общественный диалог о компаниях в индустрии медиа и развлечений. Это дает возможность оценить текущее состояние освещения новостей и прогнозировать влияние тематических аспектов на характеристики компаний. Дополнительно использование градиентного бустинга на основе алгоритма CatBoost и его оптимизация с помощью GridSearchCV показывают потенциал для эффективного предсказания принадлежности новостей к определенным кластерам. Это важный шаг в анализе влияния информационной среды на результаты компаний и их деятельность в медиасреде.

Ключевые слова

тематическое моделирование
LDA
машинное обучение
градиентный бустинг
catboost
медиакомпании