Статья подготовлена для студентов курса «Data Scientist» в образовательном проекте OTUS. Как известно, уменьшение размерности применяется в машинном обучении в двух целях: для визуализации (чтобы данные с большим количеством признаков можно было отобразить в двух- или трёхмерном пространстве) и для уменьшения количества переменных. Второе применение является более фундаментальным, базовым и основным. Здесь уместно вспомнить курс школьной математики, а точнее, систему уравнений, в которой переменных было больше, чем самих уравнений...
Видео занятия Строим корреляционную матрицу. Для этого используем надстройку «Анализ данных» Выбираем в диалоговом окне «Анализа данных» - корреляция. Далее заполняем диалоговое окно: Получим корреляционную матрицу: Наблюдается тесная связь между переменной Y и Х1, Y и X2, так как попарные коэффициенты корреляции составляют 0,8602 и 0,7479 соответственно. Это выше 0,7 – связь достаточно тесная. Межу объясняющими переменными Х1 и Х2 коэффициент составляет 0,6311. Он ниже других, но имеет значение больше 0,6...