Мультиколлинеарность – это наличие высокой взаимной корреляции между двумя или более независимыми переменными в модели Регрессии (Regression). Мультиколлинеарность может привести к искаженным или вводящим в заблуждение результатам, когда исследователь или аналитик пытается определить, насколько эффективно каждая независимая переменная может быть использована наиболее для прогнозирования значения Целевой переменной (Target Variable) в статистической модели. В общем, мультиколлинеарность может привести к более широким Доверительным интервалам (Confidence Interval), которые дают менее надежные вероятности с точки зрения влияния независимых переменных в Модели (Model). То есть статистические выводы из нее могут быть ненадежными. Примером может служить многомерная регрессионная модель, которая пытается предвидеть доходность акций на основе таких элементов, как отношение цены к прибыли (отношения P / E), рыночная капитализация или другие данные. Доходность акций является целевой переменной,
Multicollinearity в Машинном обучении простыми словами
26 сентября 202126 сен 2021
188
2 мин