Найти в Дзене
Перенос старта курса и прямой эфир с Виктором Кантором и Валерием Бабушкиным
Старт курса ML System Design переносится на 17 июля. Если вы планировали присоединиться, у вас появилось ещё немного времени, чтобы принять решение и подготовиться к обучению. В следующий понедельник, 6 июля проведем на YouTube прямой эфир. Виктор задаст Валерию вопросы о ML System Design, а Валерий ответит на них и поделится своим опытом в проектировании ML-систем. Плюс, ответим на ваши вопросы. О чем еще поговорим на эфире: ▪️зачем ML-инженеру вообще нужен System Design; ▪️как меняются требования...
3 часа назад
«Кажется, я слишком поздно начал изучать ML» Это одна из самых частых фраз, которые мы слышим от новых студентов. Кто-то откладывал обучение несколько лет. Кто-то думал, что без сильной математики в машинном обучении делать нечего. Кто-то смотрел на вакансии и был уверен, что индустрия уже переполнена специалистами. Но каждый новый поток показывает одно и то же: в ML приходят люди с очень разным опытом и стартовыми знаниями. Аналитики, разработчики, инженеры, менеджеры и даже те, кто раньше вообще не работал с данными. Главное не то, когда вы начали, а то насколько системно вы учитесь. И мы рады сообщить, что открываем набор на 5 поток курса «База ML». Это курс для тех, кто хочет разобраться в машинном обучении последовательно и без бесконечных пробелов в знаниях. От основ Python и математики до построения собственных моделей и понимания того, как ML применяется в реальных продуктах. За время обучения вы: ▪️освоите ключевые алгоритмы машинного обучения; ▪️научитесь работать с данными и строить модели на Python; ▪️разберетесь в метриках и оценке качества моделей; ▪️познакомитесь с нейронными сетями; ▪️поймете, как устроены современные ML-системы; ▪️выполните практические задания и соберете проект для портфолио. В 5 потоке мы также усилили программу темами, которые сегодня активно используются в индустрии: -применение AI-инструментов в работе ML-специалиста; -основы ML System Design; -разбор реальных бизнес-кейсов; -больше практики и поддержки от кураторов. Мы не обещаем, что путь будет простым. Машинное обучение требует времени, практики и настойчивости. Но если вы давно хотели разобраться в ML и не знали, с чего начать, сейчас хороший момент сделать первый шаг. Набор на 5 поток уже открыт, заполните форму для предзаписи: forms.yandex.ru/...ad6 Подробности о программе, формате обучения и тарифах на сайте: mlinside.ru/...026 А если у вас есть вопросы о курсе, задавайте их в комментариях. Постараемся ответить на каждый.
1 день назад
Это рубрика «ML в реальной жизни» и у нас третья задача
Мы продолжаем нашу рубрику, где задаем ситуации, с которыми сталкиваются ML/DS-команды в продакшене. В этой рубрике нет единственно правильных ответов. Её цель – научиться рассуждать, обсуждать подходы и смотреть на проблемы с разных сторон. Поэтому, если хотите, чтобы рубрика была вам максимально полезна, в комментариях важно не просто выбрать вариант, а объяснить: — почему выбрали именно его — что бы вы проверяли — какие риски вы бы учитывали...
1 неделю назад
Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Четырнадцатая задача Что нужно сделать: По разным параметрам сделать классификатор уволится человек с работы или нет (переменная attrition) Как можно сделать: ▪️Обучить классификатор на всех данных ▪️Определить при каких значениях разных переменных человек с большой вероятностью уволится. Определить топ 5 для каждого уровня образования, посмотреть насколько этот топ меняется ▪️Определить насколько важен ворк/лайф баланс ▪️Обучить свой классификатор увольнения для каждого значения переменной PerformanceRating, изменился ли топ 5 значимых переменных в этих классификатор по сравнению с топ 5 у общей модели ▪️или сделать что-то другое Данные можно взять на Kaggle: www.kaggle.com/...set Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
2 недели назад
Внимание-внимание, рубрика «ML в реальной жизни» прибывает со второй задачкой Да, это продолжение нашей рубрики, где мы задаем ситуации, с которыми сталкиваются ML/DS-команды в продакшене. В этой рубрике нет единственно правильных ответов. Её цель – научиться рассуждать, обсуждать подходы и смотреть на проблемы с разных сторон. Поэтому, если хотите, чтобы рубрика была вам максимально полезна, в комментариях важно не просто выбрать вариант, а объяснить: — почему выбрали именно его — что бы вы проверяли — какие риски вы бы учитывали Сегодня у нас ситуация №2: Ситуация: Обнаружен дрейф признака. Но не ясно, что с ним делать Контекст: Система мониторинга показала значительный дрейф распределения одного из ключевых признаков (например, время активности пользователя). Модель ещё не деградировала по метрикам, но вы видите, что данные "поехали". Ресурсы на срочный рефакторинг пайплайна ограничены. Варианты действий: Что будете делать в первую очередь? Все посты этой рубрики можно будет посмотреть по тэгу: #риллайф_MLinside
3 недели назад
Ищем руководителей и менеджеров для исследования использования ИИ в работе Мы проводим серию интервью с руководителями и менеджерами. Хотим разобраться, какие рабочие задачи они решают с помощью ИИ, что уже внедряют в свои процессы и какие сложности возникают на практике. Кого ищем: ▪️Руководителей команд ▪️Руководителей направлений ▪️Руководителей отделов ▪️Product-менеджеров ▪️Project-менеджеров ▪️Предпринимателей Что хотим узнать: ▪️Какие задачи занимают больше всего времени ▪️Для чего уже используется ИИ ▪️Что получается автоматизировать, а что не получается ▪️Каких знаний и инструментов не хватает Что конкретно от вас требуется: Если вы руководитель или менеджер, заполните короткую анкету на 2–3 минуты. Если у вас есть чуть больше времени и вы готовы ответить на дополнительные вопросы, мы будем рады пригласить вас на интервью продолжительностью 20-30 минут в любое удобное для вас время. С нас, базово, улучшить наши курсы, чтобы они отвечали вашим потребностям, ну и конечно же промокод со скидкой на подписку специализации "AI и анализ данных". Анкета в яндекс формах: forms.yandex.ru/...756
4 недели назад
Учимся на практике: решаем реальные ML-задачки Продолжаем рубрику #петпроект_MLinside – тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Тринадцатая задача Что нужно сделать: посмотреть на исторические данные об Олимпийских играх, найти зависимости и тренды Как можно сделать: ▪️Определить топ 5 стран с наибольшим количеством уникальных спортсменов в первый год за который есть данные и за последний, построить графики количества спортсменов для этих стран в зависимости от года ▪️Разделить данные на летние и зимние игры, затем сделать действия из прошлого пункта, изменился ли топ и графики? ▪️Определить максимальное количество золотых и любых медалей завоеванных одним и тем же человеком ▪️Определить для каждого года количество спортсменов которые начали выступать за другую страну ▪️Определить у какого спорта меньше всего уникальных человек завоевывали медали ▪️и т.д. Данные можно взять на Kaggle: www.kaggle.com/...lts Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 месяц назад
Устали от «идеальных» ML-кейсов? Где данные всегда чистые, метрики стабильные, а модель после обучения сразу готова к продакшену. Ведь в реальной работе всё иначе: метрики могут упасть за ночь, данные – измениться, а решение нужно принимать быстро, да еще и с неполной информацией. Поэтому мы запускаем новую рубрику «ML в реальной жизни» – здесь будут ситуации, с которыми сталкиваются ML/DS-команды в продакшене. Сразу же предупредим, что в этой рубрике нет единственно правильных ответов. Её цель – научиться рассуждать, обсуждать подходы и смотреть на проблемы с разных сторон. Поэтому, если хотите, чтобы рубрика была вам максимально полезна, в комментариях важно не просто выбрать вариант, а объяснить: — почему выбрали именно его — что бы вы проверяли — какие риски вы бы учитывали Сегодня у нас ситуация №1: Метрики упали на 40% за ночь Контекст: В продакшене работает модель прогнозирования оттока. Утром вы видите: — precision упал с 0.82 до 0.49 — recall — с 0.76 до 0.41 Последний деплой модели был 3 дня назад, изменений в пайплайне не было. Данные поступают из того же источника. Внимание, вопрос: Что будете делать в первую очередь? Откатите модель на предыдущую версию Проверите, не "поехали" ли входные данные (дрейф, пропуски, аномалии) Запустите A/B-тест: часть трафика на старую модель, часть – на текущую Свой вариант – напишу в комментариях Все посты этой рубрики можно будет посмотреть по тэгу: #риллайф_MLinside
1 месяц назад
Валерий Бабушкин и тот самый курс по ML System Design в MLinside
Если вы давно хотели разобраться, как проектируют ML-системы в реальных продуктах – это то, что вам нужно. Курс посвящён проектированию ML-систем для реальных продуктов: работе с архитектурой, пайплайнами обучения, deployment-процессами, мониторингом моделей, оптимизацией инференса и поддержкой ML под нагрузкой. Также на курсе разберём подходы к проектированию современных агентских AI-систем и интеграции LLM в production-инфраструктуру. Курс подойдёт ML-инженерам, тимлидам ML-команд и начинающим специалистам, которым нужен системный взгляд на ML...
1 месяц назад
Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Двенадцатая задача Что нужно сделать: по информации о разных приложениях нужно понять какое приложение лучше всего сделать: для большего охвата, для лучшего рейтинга, для того чтобы заработать больше денег и тд Как можно сделать: ▪️Визуализировать данные для разных классов: платные/бесплатные, разные категории, количество установок и т.д.; ▪️Применить K-Means или DBSCAN; ▪️Обучить различные классификаторы и сравнить их качество. Данные можно взять на Kaggle: www.kaggle.com/...pps Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 месяц назад
Продолжаем нашу рубрику с математическими задачками Если хотите прокачать прикладное математическое мышление, рубрика как раз для вас. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса. Вторая задачка: Симметричную монету бросают до первого выпадения орла. С какой вероятностью орел выпадет в попытке с четным номером? #math_MLinside
1 месяц назад
Почему без формулы Байеса вы не понимаете, как работает ML
Многие заходят в ML через код и модели, обучают, получают метрики и на этом этапе всё кажется понятным. Но, как только нужно пойти чуть глубже – улучшить модель или разобраться в ошибках, обязательено возникает вопрос: «Почему модель принимает именно такие решения?» Но ответ на вышеозвученный вопрос это не даст. Наверняка вы знаете, что внутри модели скрывается вполне конкретная логика работы с вероятностями. Модель постоянно пересчитывает, насколько одно событие вероятно с учётом новых данных и делает это по строгим математическим правилам...
1 месяц назад