Найти в Дзене
Сможете найти ошибку в коде?
Как дела, code-детективы? Да, это наша регулярная рубрика Code Detective. Тут мы публикуем фрагмент кода, а вы смотрите, что с ним не так. Но помните, что ошибки может и не быть. Так что если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: import pandas as pd init_df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]}) # инициализируем датафрейм...
6 дней назад
Тот самый курс по машинному обучению, который прошли 200 000 человек
С 2016 по 2022 год специализация от МФТИ и Яндекса на Coursera была «входным билетом» в профессию для каждого второго топового дата-сайентиста в СНГ. Но AI летит вперед слишком быстро. Сегодня просто знать «линейную регрессию» мало. Нужно понимать, как работают LLM, как строить AI-агентов и внедрять их в реальный бизнес. Поэтому в начале года мы запустили специализацию «Искусственный интеллект и анализ данных». Это полный путь: от основ математики до самых свежих технологий 2026 года. Что внутри...
1 неделю назад
Учимся на практике: решаем реальные ML-задачки С вами рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Седьмая задача: определение вида растения по параметрам почвы Что нужно сделать: по составу почвы (pH, влажность, азот, калий) предсказать, какой вид растения лучше всего подойдёт Как можно сделать: ▪️Использовать многоклассовую классификацию; ▪️Использовать признаки: химический состав, климат, глубина почвы; ▪️Модель: Random Forest, SVM. Данные можно взять на Kaggle:www.kaggle.com/...sett Готовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 неделю назад
Главная ошибка ML-специалиста сегодня
С появлением LLM код и прототипы стали появляться заметно быстрее. Рабочее решение можно собрать за вечер, а иногда и за несколько часов. Но всё чаще результат готов раньше, чем приходит понимание того, как это решение должно жить в продукте и какую ценность оно приносит бизнесу. Именно здесь возникает главная ошибка, ведь так легко спутать скорость реализации с профессиональной ценностью. LLM действительно ускоряют работу, снимают часть рутины и помогают быстрее дойти до рабочего варианта. Но они не думают за вас и не принимают решений за продукт...
2 недели назад
Учимся на практике: решаем реальные ML-задачки Да, это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Шестая задача: прогнозирование температуры Что нужно сделать: предсказать температуру на завтра на основе исторических данных Как можно сделать: ▪️Использовать признаки: температуру ранее, влажность, день года; ▪️Добавить лаги и сезонные признаки (месяц, неделя); ▪️Попробовать: линейную регрессию с разными признаками, Random Forest, Prophet. Данные можно взять на Kaggle: htwww.kaggle.com/...setГотовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
2 недели назад
Как на самом деле нанимает бигтех
Этим инсайдом поделился Александр Дубейковский. Сейчас он работает в Авито, а до этого несколько лет был в Яндексе и видел процесс найма изнутри. Представьте обычный день человека, который ищет первую работу в ML. Он выделяет целый рабочий день, открывает HeadHunter, LinkedIn, GetMatch и другие сервисы, где обычно размещают вакансии. Он обновляет резюме и начинает рассылать отклики и всё делает верно, пишет трогательные сопроводительные письма, изучает информацию о компаниях, в которые отправляет отклики...
3 недели назад
Учимся на практике: решаем реальные ML-задачки Это наша регулярная рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Шестая задача: оценка кредитного риска Что нужно сделать: Определить, вернёт ли человек кредит на основе его анкетных данных Как можно сделать: ▪️ Использовать признаки: возраст, доход, кредитную история, занятость; ▪️ Использовать модели: Logistic Regression, CatBoost; Данные можно взять на Kaggle: htwww.kaggle.com/...setГотовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
3 недели назад
Новый год уже совсем не за горами, и мы решили собрать список подарков, о которых мечтает любой ML-инженер. А какой из них вы бы выбрали для себя?
1 месяц назад
В этом коде есть ошибка? Наша регулярная рубрика Code Detective снова тут. Как обычно, мы публикуем фрагмент кода, а вы смотрите, что с ним не так. Но ошибки может и не быть. Так что если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: import pandas as pd df = pd.DataFrame({'category': ['A', 'B', 'C'], 'value': [1, 2, 3]}) categories = ['A', 'C'] # Хотим отфильтровать строки, где category в списке filtered = df[df['category'] in categories] Тут всё хорошо. Или нет? Есть какая-то ошибка? Если есть, напишите в комментариях: 1. Какую ошибку нашли; 2. Варианты её исправления. Ответ мы опубликуем через пару дней, а посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside
1 месяц назад
Учимся на практике: решаем реальные ML-задачки Это наша регулярная рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Пятая задача: прогнозирование спроса на товар Что нужно сделать: Узнать, сколько единиц товара будет продано завтра или на следующей неделе. Как можно сделать: ▪️ Использовать признаки: история продаж, день недели, сезон, скидки, реклама; ▪️ Добавить лаги и скользящие средние; ▪️ Попробовать: Prophet, XGBoost, ARIMA. Данные можно взять на Kaggle: hwww.kaggle.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 месяц назад
Что такое скрининг резюме и как его пройти
Думаем, вы уже знаете, что любое резюме в первую очередь сейчас рассматривает ATS, а не человек. Это не плохо и не хорошо, но это нужно учитывать, если вы хотите попасть на собеседование с реальным человеком. Скрининг, это первичная оценка релевантности резюме к вакансии. Сначала алгоритм ищет ключевые слова из вакансии и базовую совместимость формата. Затем человек проверяет здравый смысл: кто вы и что делали. Цель этого этапа - понять, стоит ли инвестировать время в интервью с вами. Теперь поговорим о том, как работает ATS...
1 месяц назад
Завтра мы будем записывать третью часть подкаста: Виктор Кантор x Валерий Бабушкин Если не смотрели первые две части, вас ждет замечательный вечер. Посмотреть выпуски можно на канале На этот раз мы поговорим про спортивную дисциплину, процессы в ML и многом другом. И именно сейчас у вас есть возможность повлиять на содержание подкаста. В комментариях вы можете написать свои вопросы Валерию Бабушкину, мы отберем самые интересные и передадим Виктору. Если хотите что-то узнать про ML System Design, работу в бигтехе или о чем-то еще - ждем вас в комментариях.
1 месяц назад