Найти тему

Categorical Variable в Машинном обучении простыми словами

Фото: @v2osk
Фото: @v2osk

Категориальная (номинальная) переменная – это переменная, которая состоит из ярлыков, и количество возможных значений часто ограничено.

Пример. Банк собирает данные о своих клиентах с целью определить, кто готов приобрести кредитный продукт. Для этого проводится анкетирование, с помощью которого выясняется:

  • Образование индивида: законченное школьное образование, бакалавриат и проч.
  • День звонка: понедельник, вторник и проч.
-2

Некоторые категории вроде "день звонка" имеют естественные взаимосвязи своих значений, например, порядок дней недели.

Стоит отметить, что если значения переменной являются ограниченным набором чисел (например, возраст), то это не категориальная, а дискретная числовая переменная.

Если же мы имеем дело с логическим типом значений (да / нет), как столбец (workinkday) в примере ниже, то ее относят к бинарным категориальным переменным.

-3

Понравилась статья? Поддержите нас, поделившись статьей в социальных сетях и подписавшись на канал. И попробуйте наши курсы по Машинному обучению на Udemy.