Категориальная (номинальная) переменная – это переменная, которая состоит из ярлыков, и количество возможных значений часто ограничено.
Пример. Банк собирает данные о своих клиентах с целью определить, кто готов приобрести кредитный продукт. Для этого проводится анкетирование, с помощью которого выясняется:
- Образование индивида: законченное школьное образование, бакалавриат и проч.
- День звонка: понедельник, вторник и проч.
Некоторые категории вроде "день звонка" имеют естественные взаимосвязи своих значений, например, порядок дней недели.
Стоит отметить, что если значения переменной являются ограниченным набором чисел (например, возраст), то это не категориальная, а дискретная числовая переменная.
Если же мы имеем дело с логическим типом значений (да / нет), как столбец (workinkday) в примере ниже, то ее относят к бинарным категориальным переменным.
Понравилась статья? Поддержите нас, поделившись статьей в социальных сетях и подписавшись на канал. И попробуйте наши курсы по Машинному обучению на Udemy.