MLinside
37
подписчиков
MLinside – это образовательный проект и онлайн-школа по машинному обучению (ML).…
Послезавтра, 29 апреля в 19:00 выходим в прямой эфир с Виктором Кантором на YouTube В эфире можно будет задать вопрос напрямую Виктору и пообщаться с ним на тему ML или AI. Также, Виктор расскажет про курс специализация «Искусственный интеллект и анализ данных». Задать вопрос Виктору заранее: forms.yandex.ru/...371 Зарегистрируйтесь на трансляцию, чтобы не пропустить начало: t.me/...426
Запускаем новую рубрику с математическими задачками
Эта рубрика поможет прокачать прикладное математическое мышление. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса...
В следующую среду, 29 апреля выходим в прямой эфир с Виктором Кантором Вы наверняка знаете Виктора – он автор специализации «Машинное обучение и анализ данных» МФТИ и Яндекса на Coursera, которую с 2016 года прошли более 200 000 человек. За его плечами построение ML-службы в Яндекс.Такси, руководство Big Data в МТС (600+ сотрудников) и звание Forbes «30 до 30». В эфире Виктор расскажет про новую специализацию «Искусственный интеллект и анализ данных» – переосмысленную версию легендарного курса, которую он выпустил вместе с командой MLinside. Полный путь от основ до нейросетей, LLM и AI-агентов по подписке от 5 000 ₽ в месяц. Но кроме этого, Виктор ответит на ваши вопросы. Это хорошая возможность спросить напрямую у человека, который сам прошёл путь от Data Scientist до топ-менеджера: ▪️ Как войти в AI/ML с нуля? ▪️ Какой путь выбрать — Data Scientist, ML-инженер, AI Engineer? ▪️ Чем новая специализация отличается от того, что уже есть на рынке? Или любой другой вопрос, на ваше усмотрение. Задайте вопрос Виктору заранее – он ответит на него в эфире: forms.yandex.ru/...371 И зарегистрируйтесь на трансляцию, чтобы не пропустить начало: t.me/...426
Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Одиннадцатая задача Что нужно сделать: определить по различным признакам, транзакция фродовая или нет Как можно сделать: ▪️Визуализировать данные чтобы визуально понять можно ли как-то кластеризовать или нет ▪️Посмотреть как-то коррелируют между собой признаки или нет ▪️Обучить модель для случая когда явный дизбаланс классов Данные можно взять на Kaggle: www.kaggle.com/...aud Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
За 2025 год мы выпустили 83 видео на YouTube И очень благодарны, что вы их смотрите, лайкаете и комментируете. Нам это очень помогает в продвижении контента. И мы решили, что не помешает сделать подборку из тех видео, которые выделились среди других. Если что-то из этого пропустили, рекомендуем посмотреть: Топ по просмотрам: ▪️ Карьера в топовых компаниях мира | Валерий Бабушкин 1 часть – просмотры: 50 169 ▪️ ML в 2025: Как начать с нуля и не слиться (Пошаговый план из опыта) | Часть 1 – просмотры: 40 271 ▪️ Зачем они нужны в ML? Собственные значения и собственные векторы – просмотры: 30 365 Топ по комментариям: ▪️ Математика в ML: сколько реально нужно знать – комментарии: 106 ▪️ Стоит ли учить ML в 2026? Или поезд уже ушёл? – комментарии: 99 ▪️ Сколько на самом деле зарабатывают ML-инженеры – комментарии: 68 Топ по лайкам: ▪️ ML в 2025: Как освоить модели и найти первую работу (Пошаговый план + Лайфхаки) | Часть 2 – лайки: 853 ▪️ "Никогда на Руси джуны хорошо не жили" | Валерий Бабушкин 2 часть – лайки: 687 ▪️ 5 тем по линейной алгебре, без которых ты не поймёшь ML – лайки: 617 Спасибо, что вы с нами, дальше – больше
Продолжаем рубрику Code Detective Сегодня формат рубрики будет необычным. Мы опубликуем часть кода, а вам нужно сказать, что он выведет. Варианты будут в опросе ниже, а объяснение мы опубликуем завтра. Если рубрика вам нравится, будем благодарны, если поставите реакцию, а другие посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside Итак, вот сама задачка: Что выведут следующие 2 примера? x = 10 y = 10 print(x is y) x = 1000 y = 1000 print(x is y) #CodeDetective_MLinside
Добавили в специализацию новый блок про агентные системы
Это следующий шаг после базовой работы с моделями, когда они становятся частью системы с доступом к данным, инструментам и логике принятия решений. Начинаем с базы: как устроен инференс LLM, что влияет на скорость и стоимость, зачем нужен kv-cache и квантование. Дальше переходим к практике – поднимаем инференс через triton, сравниваем vLLM и TensorRT и разбираемся, что выбирать под задачу. Вторая часть – полноценный разбор Retrieval-Augmented Generation, в формате как это реально собирается в проде: Отдельно разбираем диагностику, безопасность и advanced-паттерны...
Учимся на практике: решаем реальные ML-задачки, да еще и с покемонами Миллениалы на месте? Сегодня будем определять лучшего покемона с помощью ML. Да, это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Не уверены, что упоминание об этом проекте можно включить в портфолио, и поможет ли вам это на собеседованиях, но тем не менее. Десятая задача Что нужно сделать: Определить лучшего покемона каждого поколения Как можно сделать: ▪️Определить лучшие характеристики (атака, защита, хп) для каждого поколения ▪️Сделать классификационную модель определения является ли покемон легендарным или нет (переменная isLegendary) ▪️Сделать классификационную модель которая определяется цвет (Color) покемона по его характеристикам, посмотреть какие признаки важны для такой модели ▪️Посмотреть есть ли какая-то зависимость роста и веса от типа (Type_1 и Type_2 и т.д.) покемона Данные можно взять на Kaggle: www.kaggle.com/...mon Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
Как линейная алгебра помогает понять, что делает модель машинного обучения
Машинное обучение часто воспринимается как черный ящик. Кажется, что внутри происходит что-то слишком сложное и недоступное без сильной математики. Из-за этого многие откладывают старт, думая, что сначала нужно разобраться в теории. Но на базовом уровне модель работает гораздо проще, чем кажется. Если упростить, она берет признаки, применяет к ним коэффициенты и получает результат. Вся эта логика описывается инструментами линейной алгебры. Вот как это выглядит на практике: Если собрать это в одну...
Продолжаем нашу регулярную рубрику Code Detective
Напомним правила – мы публикуем фрагмент кода, а вы смотрите, что с ним не так. Но трюк в том, что ошибки может и не быть. Так что если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: funcs = [] for i in range(3): funcs...
Учимся на практике: решаем реальные ML-задачки
С вами рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Девятая задача: предсказание качества вина по его характеристикам Что нужно сделать: на основе различных характеристик вина определить каким будет его итоговое качество Как можно сделать: ▪️Обучить регрессор, затем классификатор, сравнить их качество предсказания ▪️Нормализовать данные...
PET-проекты, которые помогут собрать сильное ML-портфолио
Собрать первое ML-портфолио сейчас – не проблема. Проблема - показать работодателю, что вы готовы работать с реальными задачами. Поэтому, если вы покажете подходящие pet-проекты, то можно считать, что оффер у вас в кармане. Вот 3 типа проектов, которые особенно хорошо работают для ML-портфолио. Очевидный, но тем не менее, крайне важный совет. Используйте актуальные технологии, например, это может быть работа с большими языковыми моделями, транспортерами или современными NLP-подходами. Идеи для таких проектов можно найти прямо в вакансиях...