119 прочтений · 2 года назад
Категориальные признаки в машинном обучении
#machine learning #анализ данных #python #sklearn Существует несколько способов преобразовать категории в числа, каждый из них имеет свои плюсы и минусы. Выбор метода зависит от типа и смысла ваших данных, мощности множества категорий, алгоритма машинного обучения. Ниже приведена схема, как выбрать подходящий метод кодирования. Рассмотрим наиболее популярные методы преобразования категорий в числа. Самый простой способ – обычная нумерация значений (0, 1, 2, …). У данного подхода есть существенный недостаток...
70 прочтений · 1 год назад
Набор инструментов Data Scientist: гайд по использованию основных функций sklearn с примерами кода. Python имеет множество библиотек, которые делают его одним из наиболее часто используемых языков программирования. Большинство из них имеют схожие функции и могут использоваться друг с другом и достигать одинаковых результатов. Но когда дело доходит до машинного обучения, единственная библиотека, о которой мы можем говорить, это sklearn. Итак, в этой статье я расскажу про пять самых важных особенностей sklearn. Читать @data_analysis_ml