Найти тему
232 подписчика

Последний месяц вечерами делал pet-проект и он у меня прошел под эгидой ML - я активно (уже в третий раз наверно за всю жизнь) осваивал Catboost. И знаете, за почти 15 лет работы в разработке, я только сейчас наверное очень остро и конкретно так ощутил отсутствие математического образования. Алгоритмы, базовая борьба с нагрузкой, разные языки программирования, базы данных, фреймфорки и пр. это совсем не то, там проблемы более менее быстро закрываются гуглением, чтением нескольких док и парой видосов, может. Я сейчас про статистику, комбинаторику и прочие приколы. Многое я подучил, по каким-то моментам обратился с ученым мужам, но блин, все равно это не то. Учитесь короче, учитесь хорошо, пока есть возможность, иначе потом, возможно, будет реально тяжело.


Однако, я не про это хотел рассказать. 😊 В этот раз Catboost как раз зашёл, что называется, "как дети в школу". И все получилось. И прям сразу и достаточно точно! Если честно, я был поражен - в последний раз что-то такое было, когда я первый раз применил ClickHouse и мягко говоря удивился, когда он просто залетал вообще не напрягаясь на тех данных, с которыми postgres-у было очень тяжко. Было сложно поверить, что всё работает как надо и я не налажал, загрузив меньше данных или еще что-то в этом роде. Так вот с Catboost было то же самое - предикт (на хорошо размеченных данных) просто запустился и давал ответы достаточно точно на задаче мультиклассификации. И это при том, что для этого мне понадобилось примерно 15-20 минут для написания кода на Python. Все было настолько нативно и просто, что даже не верилось, что код на 50 строк - это вообще все, что нужно. Понятное дело, что со временем модель усложнялась и их стало даже несколько, но это уже был скорее тюниг, а просто из коробки со стандартными настройками оно уже хорошо работало у меня.

В общем, заканчивая хвалебные оды отечественным программистам 👏, хочу подчеркнуть как важно бывает сделать программу/функцию с минимальными настройками так, чтобы оно уже круто работало, НО при этом добавить удобные ручки для тюнинга. Чтобы пользователь получил первичный результат быстро и может даже не до конца понимая все, а разобравшись, сумел улучшить результат.
1 минута