Быстрое кодирование (One-Hot Encoding) – процесс, с помощью которого категориальные переменные преобразуются в подходящую алгоритмам Машинного обучения (ML) форму. Первое, что вы делаете при создании любой Модели (Model), – это, как правило, предварительная подготовка данных (Data Preparation). Мы еще не достигли такого уровня ИИ, чтобы просто передать модели таблицу и ожидать точных предсказаний. Большая часть предварительной обработки – это кодирование в понятный компьютеру язык чисел. Отсюда и название 'encode', что буквально означает «преобразовать в [компьютерный] код». Существует множество различных способов кодирования, таких как Ярлычное (Label Encoding) или Быстрое кодирование. Предположим, мы работаем с категориальными данными (кошки и собаки): Легко догадаться, что столбец "Категория" представляет в виде чисел столбец "Вид", и кодирование просто означает присвоение числа 1 собакам, а 2 – кошкам. Получив числа, компьютер теперь может их обработать. Но есть проблема: числа и
One-Hot Encoding в Машинном обучении простыми словами
2 января 20212 янв 2021
3635
2 мин