Найти в Дзене
Математика по-прежнему остаётся главным стоп-фактором в ML
«Я не понимаю производные», «Матрицы – это сложно», «Вероятность – вообще мимо меня» Это если сделать выжимку того, что нам писали в комментариях под математическими видео, говорили на кастдевах и писали менеджерам, когда мы запускали первый поток курса “Математика для ML” И наш главный вывод после первого потока: Математику можно объяснить понятно, если давать только то, что реально нужно в ML. Без перегруза и «академической воды», а с упором на применение в реальной работе. И сейчас мы открываем второй поток курса...
2 дня назад
Всем стоят, работают Code Detectives
Да, это та самая рубрика, где мы публикуем часть кода, а вам нужно сказать, что он выведет. Варианты будут в опросе ниже, а объяснение мы опубликуем позже. Не забывайте, что если рубрика вам нравится, мы будем благодарны, если поставите реакцию, а другие посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside Итак, вот сама задачка: Что выведут следующие 3 примера? x = 0...
3 дня назад
Послезавтра, 29 апреля в 19:00 выходим в прямой эфир с Виктором Кантором на YouTube В эфире можно будет задать вопрос напрямую Виктору и пообщаться с ним на тему ML или AI. Также, Виктор расскажет про курс специализация «Искусственный интеллект и анализ данных». Задать вопрос Виктору заранее: forms.yandex.ru/...371 Зарегистрируйтесь на трансляцию, чтобы не пропустить начало: t.me/...426
1 неделю назад
Запускаем новую рубрику с математическими задачками
Эта рубрика поможет прокачать прикладное математическое мышление. А умение быстро разбираться в задачах, видеть структуру и находить решения без громоздких вычислений – супер полезно не только в теории, но и в практике ML, где часто важно быстро оценить поведение системы, вероятность исходов или логику процесса...
1 неделю назад
В следующую среду, 29 апреля выходим в прямой эфир с Виктором Кантором Вы наверняка знаете Виктора – он автор специализации «Машинное обучение и анализ данных» МФТИ и Яндекса на Coursera, которую с 2016 года прошли более 200 000 человек. За его плечами построение ML-службы в Яндекс.Такси, руководство Big Data в МТС (600+ сотрудников) и звание Forbes «30 до 30». В эфире Виктор расскажет про новую специализацию «Искусственный интеллект и анализ данных» – переосмысленную версию легендарного курса, которую он выпустил вместе с командой MLinside. Полный путь от основ до нейросетей, LLM и AI-агентов по подписке от 5 000 ₽ в месяц. Но кроме этого, Виктор ответит на ваши вопросы. Это хорошая возможность спросить напрямую у человека, который сам прошёл путь от Data Scientist до топ-менеджера: ▪️ Как войти в AI/ML с нуля? ▪️ Какой путь выбрать — Data Scientist, ML-инженер, AI Engineer? ▪️ Чем новая специализация отличается от того, что уже есть на рынке? Или любой другой вопрос, на ваше усмотрение. Задайте вопрос Виктору заранее – он ответит на него в эфире: forms.yandex.ru/...371 И зарегистрируйтесь на трансляцию, чтобы не пропустить начало: t.me/...426
1 неделю назад
Учимся на практике: решаем реальные ML-задачки Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Одиннадцатая задача Что нужно сделать: определить по различным признакам, транзакция фродовая или нет Как можно сделать: ▪️Визуализировать данные чтобы визуально понять можно ли как-то кластеризовать или нет ▪️Посмотреть как-то коррелируют между собой признаки или нет ▪️Обучить модель для случая когда явный дизбаланс классов Данные можно взять на Kaggle: www.kaggle.com/...aud Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
2 недели назад
За 2025 год мы выпустили 83 видео на YouTube И очень благодарны, что вы их смотрите, лайкаете и комментируете. Нам это очень помогает в продвижении контента. И мы решили, что не помешает сделать подборку из тех видео, которые выделились среди других. Если что-то из этого пропустили, рекомендуем посмотреть: Топ по просмотрам: ▪️ Карьера в топовых компаниях мира | Валерий Бабушкин 1 часть – просмотры: 50 169 ▪️ ML в 2025: Как начать с нуля и не слиться (Пошаговый план из опыта) | Часть 1 – просмотры: 40 271 ▪️ Зачем они нужны в ML? Собственные значения и собственные векторы – просмотры: 30 365 Топ по комментариям: ▪️ Математика в ML: сколько реально нужно знать – комментарии: 106 ▪️ Стоит ли учить ML в 2026? Или поезд уже ушёл? – комментарии: 99 ▪️ Сколько на самом деле зарабатывают ML-инженеры – комментарии: 68 Топ по лайкам: ▪️ ML в 2025: Как освоить модели и найти первую работу (Пошаговый план + Лайфхаки) | Часть 2 – лайки: 853 ▪️ "Никогда на Руси джуны хорошо не жили" | Валерий Бабушкин 2 часть – лайки: 687 ▪️ 5 тем по линейной алгебре, без которых ты не поймёшь ML – лайки: 617 Спасибо, что вы с нами, дальше – больше
3 недели назад
Продолжаем рубрику Code Detective Сегодня формат рубрики будет необычным. Мы опубликуем часть кода, а вам нужно сказать, что он выведет. Варианты будут в опросе ниже, а объяснение мы опубликуем завтра. Если рубрика вам нравится, будем благодарны, если поставите реакцию, а другие посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside Итак, вот сама задачка: Что выведут следующие 2 примера? x = 10 y = 10 print(x is y) x = 1000 y = 1000 print(x is y) #CodeDetective_MLinside
3 недели назад
Добавили в специализацию новый блок про агентные системы
Это следующий шаг после базовой работы с моделями, когда они становятся частью системы с доступом к данным, инструментам и логике принятия решений. Начинаем с базы: как устроен инференс LLM, что влияет на скорость и стоимость, зачем нужен kv-cache и квантование. Дальше переходим к практике – поднимаем инференс через triton, сравниваем vLLM и TensorRT и разбираемся, что выбирать под задачу. Вторая часть – полноценный разбор Retrieval-Augmented Generation, в формате как это реально собирается в проде: Отдельно разбираем диагностику, безопасность и advanced-паттерны...
1 месяц назад
Учимся на практике: решаем реальные ML-задачки, да еще и с покемонами Миллениалы на месте? Сегодня будем определять лучшего покемона с помощью ML. Да, это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Не уверены, что упоминание об этом проекте можно включить в портфолио, и поможет ли вам это на собеседованиях, но тем не менее. Десятая задача Что нужно сделать: Определить лучшего покемона каждого поколения Как можно сделать: ▪️Определить лучшие характеристики (атака, защита, хп) для каждого поколения ▪️Сделать классификационную модель определения является ли покемон легендарным или нет (переменная isLegendary) ▪️Сделать классификационную модель которая определяется цвет (Color) покемона по его характеристикам, посмотреть какие признаки важны для такой модели ▪️Посмотреть есть ли какая-то зависимость роста и веса от типа (Type_1 и Type_2 и т.д.) покемона Данные можно взять на Kaggle: www.kaggle.com/...mon Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 месяц назад
Как линейная алгебра помогает понять, что делает модель машинного обучения
Машинное обучение часто воспринимается как черный ящик. Кажется, что внутри происходит что-то слишком сложное и недоступное без сильной математики. Из-за этого многие откладывают старт, думая, что сначала нужно разобраться в теории. Но на базовом уровне модель работает гораздо проще, чем кажется. Если упростить, она берет признаки, применяет к ним коэффициенты и получает результат. Вся эта логика описывается инструментами линейной алгебры. Вот как это выглядит на практике: Если собрать это в одну...
1 месяц назад
Продолжаем нашу регулярную рубрику Code Detective
Напомним правила – мы публикуем фрагмент кода, а вы смотрите, что с ним не так. Но трюк в том, что ошибки может и не быть. Так что если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: funcs = [] for i in range(3): funcs...
1 месяц назад