УДК 004.912
DOI: 10.36871/2618-9976.2025.10.009
Авторы
Дмитрий Григорьевич Родионов,
Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Прохор Александрович Поляков,
Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Полина Александровна Якоб,
Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Евгений Александрович Конников,
Санкт-Петербургский политехнический университет Петра Великого, Санкт-Петербург, Россия
Аннотация
Статья предлагает сценарнооптимизационный метод семантической обработки текстов аварийных инцидентов и демонстрирует его апробацию на корпусе NRC Event Notifications. Конвейер включает: предобработку и LDAтематизацию; автоаннотацию тем трансформерной моделью; целевую факторизацию PLS; регуляризованную регрессию риска с многокритериальной валидацией (goodness_of_fit, scale_errors, cv_metrics); байесовскую оптимизацию управленческих «рычагов»; построение графа тематических связей и генерацию рекомендаций, готовых к загрузке в EAM/CMMS. По итогам сравнения сценариев лидируют конфигурации PLS+Ridge (L/R) и Ridge Gamma (L/R). Оптимизационный шаг показывает доминирование темы «несанкционированный доступ» в снижении интегрального риска; граф выявляет «мостовую» роль «сбросов загрязняющих веществ» и связку с «авариями на оборудовании». Результатом является воспроизводимая трансляция текстовой аналитики в план профилактических и корректирующих работ. Метод решает проблему дрейфа и интерпретируемости, обеспечивает прослеживаемость и интеграцию с EAM/CMMS и может быть масштабирован на другие отрасли критической инфраструктуры.
Ключевые слова
семантический анализ
LDA
PLS
байесовская оптимизация
управление рисками
атомная энергетика
EAM/CMMS
регуляризованная регрессия
граф знаний
инциденты

