Машинное обучение три способа работы с числовыми пизнаками.
Объединение числовых признаков в группы на основе числовых интервалов , в которые попадает исходное значение, может увеличить производительность модели. Во-первых, приведение к двоичным признакам может быть сделано, благодаря знаний предметной области датасетов, чтобы улучшить производительность моделей. Во-вторых, данные всегда содержат ошибки измерения, и бинаризация данных может уменьшить влияние этих ошибок. Один из распространенных подходов кроме бинаризации числовых признаков основан на алгоритме k-средних...