Авторы
И.В. ОРЛОВА
Аннотация
Данная статья посвящена анализу методов, направленных на решение проблемы мультиколлинеарности данных, возникающей по причине высокой информационной избыточности метрических данных. Принятие решений в современных условиях базируется на анализе огромных объемов данных, часто имеющих лишь небольшой информационный контент, а это означает, что высока информационная избыточность. В случае с моделью линейной регрессии мультиколлинеарность можно интерпретировать как тип избыточности. Рассматривается возможность применения теста PETRES Red –красного индикатора для измерения доли полезного контента при оценке параметров линейной регрессии, т.е. для количественной оценки степени избыточности. В статье приводится сравнительный анализ теста PETRES Red с наиболее используемыми процедурами обнаружения мультиколлинеарности среди регрессоров, которые реализованы в R-пакете mctest: тест Фаррара-Глоубера, VIF (фактор инфляции дисперсии) и методом Бэлсли, реализованным в Gretl. Сравнительный анализ выполнен на данных по 186 предприятиям, относящихся к виду деятельности добыча сырой нефти за 2016 г. Решена задача выявления и устранения мультиколлинеарности. Сделан вывод о целесообразности применения комплексного подхода к тестированию мультиколлинеарности с помощью R-пакета mctest, который вычисляет общие и индивидуальные диагностические тесты мультиколлинеарности.
Ключевые слова
мультиколлинеарность, информационная избыточность, красный индикатор, R-пакет mctest, Gretl.