Источник: Nuances of Programming Категориальные признаки необходимо преобразовывать, прежде чем использовать их в модели. Зачастую это делается с помощью прямого кодирования — в итоге получаем бинарную переменную для каждой категории. Проблемы не возникают до попытки понять модель с помощью метода SHAP. Каждая бинарная переменная будет иметь свое собственное значение SHAP. Это затрудняет понимание общего вклада исходного категориального признака. Для решения этой проблемы используется простой подход — сложение значений SHAP для каждой бинарной переменной...
Переменные были придуманы математиками не только для того, чтобы сохранять в них какие-то значения. Над переменными можно выполнять разные действия: складывать, перемножать, вычитать, возводить в степень и т.п. Список действий довольно большой. А поскольку основное назначение программируемых устройств - это облегчение математических вычислений (слово “компьютер” можно перевести как “вычислитель”, а ЭВМ - это Электронная Вычислительная Машина), то многие свойства переменных перешли из математики в программирование...