УДК 51-77
DOI: 10.36871/2618-9976.2023.06.002

Авторы

Ирина Евгеньевна Калина,
Магистр, инженер-исследователь, Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия
Юлия Дмитриевна Соколова,
Магистр, лаборант-исследователь, Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия
Алексей Витальевич Шевчук,
Магистр, ассистент, Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия
Олег Святославович Мариев,
Институт экономики Уральского отделения Российской академии наук, Екатеринбург, Россия

Аннотация

В данной статье авторы оценивают степени освещенности новостей по темам посредством применения структурного тематического моделирования. На подготовительном этапе проводится автоматизированный сбор и систематизация информации с новостного интернет-портала Лента.ру, преобразование слов в единую форму, очистка текстовых данных от стоп-слов. В работе применяется метод структурного тематического моделирования (STM), позволивший выделить 25 наиболее популярных для публикации тем на новостном портале и определить частоту встречаемости слов в теме и их уникальность. Корреляционный и регрессионный анализы указали на взаимосвязь исследуемых тем и изменение степени освещенности тем во времени.

Ключевые слова

тематическое моделирование
новости
новостной портал
корреляционный анализ
регрессионный анализ