Найти в Дзене

Предобработка данных ML. Какие бывают признаки.

Процесс предобработки данных заключается в том, что перед подачей данных в модель мы совершаем набор определённых действий с ними. Что мы можем сделать с данными? Во-первых можем их почистить от лишней информации. А можем, наоборот дополнить. Так же бывает необходимо провести центрирование, нормализацию, сдвиг, вращение, обрезку.
Данные у нас содержатся в табличном виде. В таблице есть объекты и

Процесс предобработки данных заключается в том, что перед подачей данных в модель мы совершаем набор определённых действий с ними. Что мы можем сделать с данными? Во-первых можем их почистить от лишней информации. А можем, наоборот дополнить. Так же бывает необходимо провести центрирование, нормализацию, сдвиг, вращение, обрезку.

Данные у нас содержатся в табличном виде. В таблице есть объекты и у этих объектов есть свои определенные свойства. Эти свойства и есть признаки, например стоимость, температура, звание и т.д.. И уже эти признаки разделяются на типы.

Какие бывают признаки:

1. Категориальные (номинальные).

признак, значения которого обозначают принадлежность объекта к какой-либо категории - пол, профессия.

2. Числовые (количественные).

возраст, стоимость, температура и т.д.

3. Ординальные (порядковые)

признаки которые можно расставить по возрастанию-убыванию, другими словами такие признаки, которые можно упорядочить, например воинское звание.

Какие еще бывают данные:

  • Временные ряды
  • Изображения
  • Тексты
  • И другие данные

Признаки разбивают на типы по причине что не все методы обработки данных подходят для всех признаков, так же для отдельных типов данных требуется дополнительная предобработка.

P.S. Если, нашли ошибки, недочёты или хотите дополнить сказанное, всегда рада конструктивному мнению специалистов.