121 читали · 2 года назад
Категориальные признаки в машинном обучении
#machine learning #анализ данных #python #sklearn Существует несколько способов преобразовать категории в числа, каждый из них имеет свои плюсы и минусы. Выбор метода зависит от типа и смысла ваших данных, мощности множества категорий, алгоритма машинного обучения. Ниже приведена схема, как выбрать подходящий метод кодирования. Рассмотрим наиболее популярные методы преобразования категорий в числа. Самый простой способ – обычная нумерация значений (0, 1, 2, …). У данного подхода есть существенный недостаток...
Cardinality в Машинном обучении простыми словами
Мощность – 1. Количество уникальных значений Признака (Feature). Понятие "Высокая мощность" применимо, как следствие, к признакам с уникальным обширным набором возможных значений. 2.Число вершин Графа (Graph) Нейронной сети (Neural Network). Мощность одного признака. Например, если список A имеет конечное число элементов, его мощность – это просто количество элементов. Если A = [2,4,6,8,10], то мощность равна 5. Мощность пар признаков. Пример. Мы выделили уникальные значения двух признаков датасета:...