Представьте себе, что вы решили испечь идеальный пирог. Вы открываете старую бабушкину тетрадь и видите странный совет: добавить в тесто и сахар, и сахарную пудру, и еще ложку меда. Вроде бы ингредиенты разные, но все они выполняют одну и ту же работу — делают десерт сладким. Когда вы попытаетесь понять, какой именно компонент сделал пирог божественным, вы запутаетесь. Вот примерно в такой же тупик заходят математики и аналитики данных, когда сталкиваются с одним капризным явлением. Итак, мультиколлинеарность – это что? Выражаясь простым языком, это ситуация в статистике, когда два или более факторов в вашей модели слишком сильно «дружат» между собой. Они настолько тесно связаны, что начинают дублировать друг друга, сбивая с толку алгоритм. Это как если бы вы наняли двух сотрудников на одну и ту же узкую задачу: оба шумят, создают видимость бурной деятельности, но кто из них реально приносит результат — бог весть. Зачем вообще ломать голову над вопросом «мультиколлинеарность – это что?