Как я говорил ранее, прежде чем начать построение любой модели данные следует подготовить. Один из таких этапов - это удаление лишних, избыточных данных. Но как понять какие данные лишние? Для начала разобъём наш dataset на векторы-столбцы, то есть векторы будут хранить значения всех объектов своего одного признака. Одна из таких техник - это поиск линейно зависимых признаков. Линейная зависимость является симптомом того, что один признак может быть выведен из другого признака. Например, хранение одних и тех же данных в разных размерностях...
Сегодня мы узнаем 1. Что такое векторы и для чего они нужны аналитику данных 2. Какие операции с векторами можно делать (складывание, вычитание) и в чем их смысл 3. Как работать с векторами в Python 1. Что такое векторы и для чего они нужны аналитику данных В векторах хранят некоторые цифровые данные. Например, вектор, описывающий кота, мог бы выглядеть как набор цифр его возраста, веса, количества зубов, окраски (зашифрованной цветом) и других характеристик. Набор из 5 подобных векторов описывал бы всех котов тети Вали...