УДК 004.912
DOI: 10.36871/2618­-9976.2025.10.009

Авторы

Дмитрий Григорьевич Родионов,
Санкт­-Петербургский политехнический университет Петра Великого, Санкт­-Петербург, Россия
Прохор Александрович Поляков,
Санкт­-Петербургский политехнический университет Петра Великого, Санкт­-Петербург, Россия
Полина Александровна Якоб,
Санкт­-Петербургский политехнический университет Петра Великого, Санкт­-Петербург, Россия
Евгений Александрович Конников,
Санкт­-Петербургский политехнический университет Петра Великого, Санкт­-Петербург, Россия

Аннотация

Статья предлагает сценарно­оптимизационный метод семантической обработки текстов аварийных инцидентов и демонстрирует его апробацию на корпусе NRC Event Notifications. Конвейер включает: предобработку и LDA­тематизацию; автоаннотацию тем трансформерной моделью; целевую факторизацию PLS; регуляризованную регрессию риска с многокритериальной валидацией (goodness_of_fit, scale_errors, cv_metrics); байесовскую оптимизацию управленческих «рычагов»; построение графа тематических связей и генерацию рекомендаций, готовых к загрузке в EAM/CMMS. По итогам сравнения сценариев лидируют конфигурации PLS+Ridge (L/R) и Ridge Gamma (L/R). Оптимизационный шаг показывает доминирование темы «несанкционированный доступ» в снижении интегрального риска; граф выявляет «мостовую» роль «сбросов загрязняющих веществ» и связку с «авариями на оборудовании». Результатом является воспроизводимая трансляция текстовой аналитики в план профилактических и корректирующих работ. Метод решает проблему дрейфа и интерпретируемости, обеспечивает прослеживаемость и интеграцию с EAM/CMMS и может быть масштабирован на другие отрасли критической инфраструктуры.

Ключевые слова

семантический анализ
LDA
PLS
байесовская оптимизация
управление рисками
атомная энергетика
EAM/CMMS
регуляризованная регрессия
граф знаний
инциденты