Предпоследний романтик: зачем изобрели градиентный бустинг?
Градиентный бустинг: Как просто сделать сложное!
Не несмотря на то, что градиентный бустинг используется повсеместно, многие практики до сих пор относятся к нему, как к сложному алгоритму в черном ящике и просто запускают готовые модели из предустановленных библиотек. Вот представьте, вы находитесь перед этим "черным ящиком" и задумываетесь, как бы вы его открыли и посмотрели, как он работает. Ну, именно это и будет нашей целью в этой статье! Пристегните ремни, дорогие читатели "Аналитик Шоу", ведь сегодня мы отправляемся в увлекательное путешествие в мир градиентного бустинга...
Тюнинг CatBoost - градиентного бустинга от Яндекс
Как настроить один из лучших инструментов градиентного бустинга - CatBoost. Рассмотрим на примере. Для демонстрации работы будем использовать сгенерированный набор для предсказания расходов людей, который зависит от их доходов и размера дотаций из городского бюджета: При этом формула этой взаимосвязи следующая (data_m - имя датафрейма): data_m['расходы'] = 2*np.sqrt(data_m['зарплата'])+0.5*data_m['сумма_помощи'] Задача - использовать CatBoost для предсказания расходов. Посмотрим, сможет ли алгоритм справиться с поставленной задачей...