Рассмотрим, как производить выборку алгоритмов машинного обучения с библиотекой Scikit-learn. Для работы используем поставляемый с библиотекой датасет:
Разделим датасет на выборки:
Создадим пайплайн машинного обучения и выведем метрики качества:
Теперь с помощью RandomizedSearchCV или GridSearchCV можно попытаться найти оптимальный алгоритм и параметры к нему. Для этого разные алгоритмы следует заключать в отдельные словари списка (если перебираемые свойства отличаются), синтаксис обращения к свойствам - посредством указания имени шага, затем двойного подчеркивания и имени свойства (писал ранее):
Выведем полученные параметры: