Найти в Дзене
PythonTalk

Священная война бустингов

🥊 Если вы работаете со сложными табличными данными, то всё сводится к трём игрокам: XGBoost, LightGBM и CatBoost. Казалось бы, три реализуют одну и ту же математическую идею. И с точки зрения "чистой" точности при бесконечном времени на тюнинг гиперпараметров все три библиотеки дадут плюс-минус одинаковый результат. Но дьявол, как обычно, в деталях реализации и инженерных компромиссах. В карточках разобрал основную разницу между этими инструментами и свёл все в итоговую табличку для выбора 👉 #два_стула

Священная война бустингов 🥊

Если вы работаете со сложными табличными данными, то всё сводится к трём игрокам: XGBoost, LightGBM и CatBoost.

Казалось бы, три реализуют одну и ту же математическую идею. И с точки зрения "чистой" точности при бесконечном времени на тюнинг гиперпараметров все три библиотеки дадут плюс-минус одинаковый результат. Но дьявол, как обычно, в деталях реализации и инженерных компромиссах.

В карточках разобрал основную разницу между этими инструментами и свёл все в итоговую табличку для выбора 👉

#два_стула

-2
-3
-4
-5
-6
-7
-8
-9