Добавить в корзинуПозвонить
Найти в Дзене

ML. Нормализация данных.

Есть алгоритмы, которые чувствительны к масштабу признаков. Такие алгоритмы хуже сходятся к оптимальным значениям, когда типы данных разные. Как раз нормализация - один из способов нам помочь.
Нормализация - это такой процесс, в ходе которого мы приводим данные к одному масштабу.
Что нам даёт нормализация? После нормализации данных мы получаем более хорошие условия для выборки, изменения данных и

Есть алгоритмы, которые чувствительны к масштабу признаков. Такие алгоритмы хуже сходятся к оптимальным значениям, когда типы данных разные. Как раз нормализация - один из способов нам помочь.

Нормализация - это такой процесс, в ходе которого мы приводим данные к одному масштабу.

Что нам даёт нормализация? После нормализации данных мы получаем более хорошие условия для выборки, изменения данных и для их удаления. Почему нам так нужна нормализация? Это можно связать с сутью алгоритмов и математических моделей. По причине того, что данные могут описывать совершенно разные явления и показатели, их значения могут разниться в несколько порядков.

Какие базовые методы нормализации есть:

  • MinMax нормализация. С помощью этого метода мы приводим все данные к масштабу от 0 до 1.
  • Стандартная нормализация. Данные будут иметь среднее равное 0 и стандартное отклонение равное 1.

Случается так, что данные лучше удалить. Обычно это признаки, которые посчитали по ошибке или они просто не несут никакой полезной информации. В столбце везде записаны одни и те же значения, все данные одинаковые.

! Нормализация помогает не всем алгоритмам, тем не менее обычно хуже она алгоритму не сделает.

P.S. Если, нашли ошибки, недочёты или хотите дополнить сказанное, всегда рада конструктивному мнению специалистов.