Найти тему
Властелин машин

Ключевые плюшки от подбора гиперпараметров в Sklearn

Изобилие плохо, когда его нет у тебя и оно есть у соседа.

Рассмотрим, какие ценные сведения можно извлечь по итогам перебора гиперпараметров вашей модели и как это сделать. Сначала загрузим тестовый набор данных:

Теперь распределим колонки по типам и затем разобьем данные на два датасета:

-2

Ниже проведем подбор гиперпараметров с GridSearchCV:

-3

Алгоритм с лучшими параметрами на валидационном наборе можно извлечь из свойства best_estimator_:

-4

В best_score_ и best_params_ содержатся значение валидационной метрики и параметров найденной оптимальной модели:

-5

Не менее полезна сводная статистика для каждого набора параметров, хранящаяся в свойстве cv_results_:

-6

Как можно заметить, по полю rank_test_score можно упорядочить результаты и вывести статистику для выбранной модели, например, время обучения и предсказания:

-7

Это же можно сделать и по-другому, обратившись к строке с номером best_index_:

-8

-9

Наука
7 млн интересуются