Найти в Дзене
Устали от «идеальных» ML-кейсов? Где данные всегда чистые, метрики стабильные, а модель после обучения сразу готова к продакшену. Ведь в реальной работе всё иначе: метрики могут упасть за ночь, данные – измениться, а решение нужно принимать быстро, да еще и с неполной информацией. Поэтому мы запускаем новую рубрику «ML в реальной жизни» – здесь будут ситуации, с которыми сталкиваются ML/DS-команды в продакшене. Сразу же предупредим, что в этой рубрике нет единственно правильных ответов. Её цель – научиться рассуждать, обсуждать подходы и смотреть на проблемы с разных сторон. Поэтому, если хотите, чтобы рубрика была вам максимально полезна, в комментариях важно не просто выбрать вариант, а объяснить: — почему выбрали именно его — что бы вы проверяли — какие риски вы бы учитывали Сегодня у нас ситуация №1: Метрики упали на 40% за ночь Контекст: В продакшене работает модель прогнозирования оттока. Утром вы видите: — precision упал с 0.82 до 0.49 — recall — с 0.76 до 0.41 Последний деплой модели был 3 дня назад, изменений в пайплайне не было. Данные поступают из того же источника. Внимание, вопрос: Что будете делать в первую очередь? Откатите модель на предыдущую версию Проверите, не "поехали" ли входные данные (дрейф, пропуски, аномалии) Запустите A/B-тест: часть трафика на старую модель, часть – на текущую Свой вариант – напишу в комментариях Все посты этой рубрики можно будет посмотреть по тэгу: #риллайф_MLinside
1 день назад
Валерий Бабушкин и тот самый курс по ML System Design в MLinside
Если вы давно хотели разобраться, как проектируют ML-системы в реальных продуктах – это то, что вам нужно. Курс посвящён проектированию ML-систем для реальных продуктов: работе с архитектурой, пайплайнами обучения, deployment-процессами, мониторингом моделей, оптимизацией инференса и поддержкой ML под нагрузкой. Также на курсе разберём подходы к проектированию современных агентских AI-систем и интеграции LLM в production-инфраструктуру. Курс подойдёт ML-инженерам, тимлидам ML-команд и начинающим специалистам, которым нужен системный взгляд на ML...
1 неделю назад
Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Двенадцатая задача Что нужно сделать: по информации о разных приложениях нужно понять какое приложение лучше всего сделать: для большего охвата, для лучшего рейтинга, для того чтобы заработать больше денег и тд Как можно сделать: ▪️Визуализировать данные для разных классов: платные/бесплатные, разные категории, количество установок и т.д.; ▪️Применить K-Means или DBSCAN; ▪️Обучить различные классификаторы и сравнить их качество. Данные можно взять на Kaggle: www.kaggle.com/...pps Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 неделю назад
Продолжаем нашу рубрику с математическими задачками Если хотите прокачать прикладное математическое мышление, рубрика как раз для вас. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса. Вторая задачка: Симметричную монету бросают до первого выпадения орла. С какой вероятностью орел выпадет в попытке с четным номером? #math_MLinside
2 недели назад
Почему без формулы Байеса вы не понимаете, как работает ML
Многие заходят в ML через код и модели, обучают, получают метрики и на этом этапе всё кажется понятным. Но, как только нужно пойти чуть глубже – улучшить модель или разобраться в ошибках, обязательено возникает вопрос: «Почему модель принимает именно такие решения?» Но ответ на вышеозвученный вопрос это не даст. Наверняка вы знаете, что внутри модели скрывается вполне конкретная логика работы с вероятностями. Модель постоянно пересчитывает, насколько одно событие вероятно с учётом новых данных и делает это по строгим математическим правилам...
2 недели назад
Математика по-прежнему остаётся главным стоп-фактором в ML
«Я не понимаю производные», «Матрицы – это сложно», «Вероятность – вообще мимо меня» Это если сделать выжимку того, что нам писали в комментариях под математическими видео, говорили на кастдевах и писали менеджерам, когда мы запускали первый поток курса “Математика для ML” И наш главный вывод после первого потока: Математику можно объяснить понятно, если давать только то, что реально нужно в ML. Без перегруза и «академической воды», а с упором на применение в реальной работе. И сейчас мы открываем второй поток курса...
2 недели назад
Всем стоят, работают Code Detectives
Да, это та самая рубрика, где мы публикуем часть кода, а вам нужно сказать, что он выведет. Варианты будут в опросе ниже, а объяснение мы опубликуем позже. Не забывайте, что если рубрика вам нравится, мы будем благодарны, если поставите реакцию, а другие посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside Итак, вот сама задачка: Что выведут следующие 3 примера? x = 0...
3 недели назад
Послезавтра, 29 апреля в 19:00 выходим в прямой эфир с Виктором Кантором на YouTube В эфире можно будет задать вопрос напрямую Виктору и пообщаться с ним на тему ML или AI. Также, Виктор расскажет про курс специализация «Искусственный интеллект и анализ данных». Задать вопрос Виктору заранее: forms.yandex.ru/...371 Зарегистрируйтесь на трансляцию, чтобы не пропустить начало: t.me/...426
3 недели назад
Запускаем новую рубрику с математическими задачками
Эта рубрика поможет прокачать прикладное математическое мышление. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса...
4 недели назад
В следующую среду, 29 апреля выходим в прямой эфир с Виктором Кантором Вы наверняка знаете Виктора – он автор специализации «Машинное обучение и анализ данных» МФТИ и Яндекса на Coursera, которую с 2016 года прошли более 200 000 человек. За его плечами построение ML-службы в Яндекс.Такси, руководство Big Data в МТС (600+ сотрудников) и звание Forbes «30 до 30». В эфире Виктор расскажет про новую специализацию «Искусственный интеллект и анализ данных» – переосмысленную версию легендарного курса, которую он выпустил вместе с командой MLinside. Полный путь от основ до нейросетей, LLM и AI-агентов по подписке от 5 000 ₽ в месяц. Но кроме этого, Виктор ответит на ваши вопросы. Это хорошая возможность спросить напрямую у человека, который сам прошёл путь от Data Scientist до топ-менеджера: ▪️ Как войти в AI/ML с нуля? ▪️ Какой путь выбрать — Data Scientist, ML-инженер, AI Engineer? ▪️ Чем новая специализация отличается от того, что уже есть на рынке? Или любой другой вопрос, на ваше усмотрение. Задайте вопрос Виктору заранее – он ответит на него в эфире: forms.yandex.ru/...371 И зарегистрируйтесь на трансляцию, чтобы не пропустить начало: t.me/...426
1 месяц назад
Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Одиннадцатая задача Что нужно сделать: определить по различным признакам, транзакция фродовая или нет Как можно сделать: ▪️Визуализировать данные чтобы визуально понять можно ли как-то кластеризовать или нет ▪️Посмотреть как-то коррелируют между собой признаки или нет ▪️Обучить модель для случая когда явный дизбаланс классов Данные можно взять на Kaggle: www.kaggle.com/...aud Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 месяц назад
За 2025 год мы выпустили 83 видео на YouTube И очень благодарны, что вы их смотрите, лайкаете и комментируете. Нам это очень помогает в продвижении контента. И мы решили, что не помешает сделать подборку из тех видео, которые выделились среди других. Если что-то из этого пропустили, рекомендуем посмотреть: Топ по просмотрам: ▪️ Карьера в топовых компаниях мира | Валерий Бабушкин 1 часть – просмотры: 50 169 ▪️ ML в 2025: Как начать с нуля и не слиться (Пошаговый план из опыта) | Часть 1 – просмотры: 40 271 ▪️ Зачем они нужны в ML? Собственные значения и собственные векторы – просмотры: 30 365 Топ по комментариям: ▪️ Математика в ML: сколько реально нужно знать – комментарии: 106 ▪️ Стоит ли учить ML в 2026? Или поезд уже ушёл? – комментарии: 99 ▪️ Сколько на самом деле зарабатывают ML-инженеры – комментарии: 68 Топ по лайкам: ▪️ ML в 2025: Как освоить модели и найти первую работу (Пошаговый план + Лайфхаки) | Часть 2 – лайки: 853 ▪️ "Никогда на Руси джуны хорошо не жили" | Валерий Бабушкин 2 часть – лайки: 687 ▪️ 5 тем по линейной алгебре, без которых ты не поймёшь ML – лайки: 617 Спасибо, что вы с нами, дальше – больше
1 месяц назад