Для численного представления категорий в моделях машинного обучения существуют разные методики (распространенные примеры OneHotEncoder и OrdinalEncoder). Рассмотрим одну из них - BinaryEncoder, которая напоминает OneHotEncoder, так как ставит каждой категории в соответствие вектор из 0 и 1, но в отличие от него формирует более плотное представление. Так, если OneHotEncoder ставит категории в соответствии вектор со всеми 0 и лишь одной 1 на месте порядкового номера этой категории в общем списке (соответственно, вектор имеет размерность N - количество уникальных категорий), то бинарный кодировщик каждому порядковому номеру уникальной категории ставит в соответствие его битовое представление (количество категорий - logN). Одна из реализаций бинарного кодировщика реализована в классе BinaryEncoder библиотеки category_encoders. Для демонстрации его работы рассмотрим датафрейм: Создадим экземпляр класса, обучим и запустим трансформер: В конструктор класса можно передать параметр (cols) со с