Найти в Дзене

➡️ Наш код в Гарварде: почему Яндекс.CatBoost стал мировым стандартом в науке (и в моем арсенале

) 🚀 #ИИ_в_медицине ⚡️ Те, кто давно читает мой блог, знают: я не только оперирующий хирург, но и Data Scientist. ✔️ В своих исследованиях я постоянно ищу ответы: что именно влияет на успех операции? Как предсказать осложнения с точностью до процента? Моим главным инструментом для этого давно стал CatBoost. И как выяснилось на днях — не только моим. 📊 Мировое признание российской технологии ⚡️ Американское издание Marktechpost выпустило глобальный отчет ML Global Impact Report 2025. 🟡 Цифры впечатляют: Python-библиотека CatBoost, разработанная компанией «Яндекс», вошла в топ самых используемых инструментов машинного обучения в мире. 🟡 Ее используют ученые из 51 страны. Исследователи из Harvard, MIT и Stanford строят свои научные работы на российском алгоритме. На долю США приходится 13% всех статей с его использованием. Он встал в один ряд с инструментами от гигантов вроде Google и Microsoft. 🧐 Что такое CatBoost и почему он круче других? 🤯 CatBoost — это алгоритм градиентно

➡️ Наш код в Гарварде: почему Яндекс.CatBoost стал мировым стандартом в науке (и в моем арсенале) 🚀

#ИИ_в_медицине

⚡️ Те, кто давно читает мой блог, знают: я не только оперирующий хирург, но и Data Scientist.

✔️ В своих исследованиях я постоянно ищу ответы: что именно влияет на успех операции? Как предсказать осложнения с точностью до процента? Моим главным инструментом для этого давно стал CatBoost. И как выяснилось на днях — не только моим.

📊 Мировое признание российской технологии

⚡️ Американское издание Marktechpost выпустило глобальный отчет ML Global Impact Report 2025.

🟡 Цифры впечатляют: Python-библиотека CatBoost, разработанная компанией «Яндекс», вошла в топ самых используемых инструментов машинного обучения в мире.

🟡 Ее используют ученые из 51 страны. Исследователи из Harvard, MIT и Stanford строят свои научные работы на российском алгоритме. На долю США приходится 13% всех статей с его использованием. Он встал в один ряд с инструментами от гигантов вроде Google и Microsoft.

🧐 Что такое CatBoost и почему он круче других?

🤯 CatBoost — это алгоритм градиентного бустинга на решающих деревьях (алгоритм машинного обучения). Это алгоритм, собранный в отдельную "библиотеку" на языке Python (грубо говоря - набор функций, упакованный в одно место, чтобы применять его легко и просто "из коробки").

🔜 Представьте, что вы собираете консилиум врачей.

🟡Первый врач ставит диагноз, но ошибается в 30% случаев.

🟡Второй врач смотрит не на пациента, а на ошибки первого, и пытается исправить именно их.

🟡Третий врач исправляет ошибки второго.

🔜 В итоге у вас ансамбль из сотен таких "врачей", который работает точнее, чем любой гений-одиночка. Это и есть бустинг.

✔️ Битва титанов: CatBoost vs XGBoost

🔜 Долгое время королем был американский XGBoost (градиентный бустинг). Но у него (и других аналогов) была ахиллесова пята — они плохо понимали слова.

👇 В медицине данные — это часто категории:

🟡Пол (М/Ж)

🟡Группа крови (I, II, III, IV)

🟡Тип перелома (A, B, C)

🔜 Для XGBoost эти слова нужно превращать в набор цифр (One-Hot Encoding), что раздувает данные и усложняет вычисления.

🔥 В чем гениальность Яндекса? Название CatBoost происходит от Categorical (категориальный).

🔜 Разработчики придумали математический метод (Ordered Target Statistics), который позволяет алгоритму «кушать» категории в исходном виде, не заглядывая в будущее и не переобучаясь.

⚠️ Он работает точнее, быстрее и требует меньше танцев с бубном при подготовке данных.

🏥 Почему ТЕПЕРЬ это "золотой стандарт" машинного обучения в медицине?

✏️ Нейросети (Deep Learning) хороши для картинок и текстов.

⚠️ Но 90% медицинских данных — это таблицы (истории болезни, анализы). ⚡️ В работе с таблицами CatBoost сейчас — абсолютный чемпион.

💬 В мире с его помощью уже прогнозируют рецидивы рака печени, диагностируют Альцгеймер на ранних стадиях и рассчитывают риски преждевременных родов.

👨‍⚕️ А что у нас?

➡️ Я продолжаю использовать этот мощнейший инструмент для анализа наших клинических данных.

✏️ Скоро я покажу вам наглядные примеры: как мы скармливаем алгоритму сотни параметров пациента и получаем прогноз, который помогает выбрать идеальную тактику лечения.

🔥 Важный анонс!

⚡️ Мы с командой шагнули еще и в Computer Vision (компьютерное зрение).

➡️ Мы обучили нейросеть по сегментации костных кист (выделение кист костей - очерчивание с расчетом плотности костной ткани в этой зоне).

✔️ Это уже не таблички, это автоматическое распознавание патологии на снимках, где ИИ сам обводит границы образования с точностью опытного рентгенолога.

🔥 Совсем скоро проведем презентацию и покажем, как это работает. Будущее уже здесь, и мы его создаем.

📱 Запись на консультацию, информация обо мне и помощь с анализом данных через моего бота --> https://t.me/docSemenovAV_bot