153 читали · 3 года назад
Multicollinearity в Машинном обучении простыми словами
Мультиколлинеарность – это наличие высокой взаимной корреляции между двумя или более независимыми переменными в модели Регрессии (Regression). Мультиколлинеарность может привести к искаженным или вводящим в заблуждение результатам, когда исследователь или аналитик пытается определить, насколько эффективно каждая независимая переменная может быть использована наиболее для прогнозирования значения Целевой переменной (Target Variable) в статистической модели. В общем, мультиколлинеарность может привести...
196 читали · 6 лет назад
Как бороться с мультиколлинеарностью?
Статья подготовлена для студентов курса «Data Scientist» в образовательном проекте OTUS. Как известно, уменьшение размерности применяется в машинном обучении в двух целях: для визуализации (чтобы данные с большим количеством признаков можно было отобразить в двух- или трёхмерном пространстве) и для уменьшения количества переменных. Второе применение является более фундаментальным, базовым и основным. Здесь уместно вспомнить курс школьной математики, а точнее, систему уравнений, в которой переменных было больше, чем самих уравнений...