О ЗАДАЧАХ МАШИННОГО ОБУЧЕНИЯ ЗА 21 МИНУТУ || кластеризация, классификация, восстановление функции, редуцирование размерности пространства
Категориальные признаки в машинном обучении
#machine learning #анализ данных #python #sklearn Существует несколько способов преобразовать категории в числа, каждый из них имеет свои плюсы и минусы. Выбор метода зависит от типа и смысла ваших данных, мощности множества категорий, алгоритма машинного обучения. Ниже приведена схема, как выбрать подходящий метод кодирования. Рассмотрим наиболее популярные методы преобразования категорий в числа. Самый простой способ – обычная нумерация значений (0, 1, 2, …). У данного подхода есть существенный недостаток...
Последовательный отбор признаков для модели машинного обучения
Как известно, некоторые признаки, характеризующие объекты в моделях машинного обучения могут оказаться фиктивными или избыточными. Соответственно, их включение в пайплайн может привести к снижению качества прогнозов. Рассмотрим, один из популярных способов оптимизации набора признаков, который заключается в формировании их множества путем последовательного добавления по одному наиболее эффективному.
То есть сначала работа модели тестируется на каждом отдельном признаке и выбирается максимизирующий...