Найти в Дзене
MLinside

Учимся на практике: решаем реальные ML-задачки

Теория без практики быстро забывается. А вот решение задач из реальных проектов это то, что останется в портфолио и поможет на собеседованиях. Поэтому мы запускаем новую рубрику с мини-кейсами по ML, которые можно решать вместе с нами. Все посты можно будет посмотреть по тэгу: #петпроект_MLinside Первая задача: предсказание цен на недвижимость. Это классика для Data Scientist и отличное упражнение, чтобы потренировать базовые навыки. Что предстоит сделать: Данные можно взять на Kaggle: https://www.kaggle.com/c/house-prices-advanced-regression-techniques. Эта задачка похожа на то, что нужно будет делать ML-инженеру: банки, страховые компании и маркетплейсы решают подобные кейсы каждый день. Сделав эту задачку, вы сможете показать, что умеете мыслить как ML-специалист и писать работающий код. Готовы попробовать? Делитесь своими результатами в комментариях.

Теория без практики быстро забывается. А вот решение задач из реальных проектов это то, что останется в портфолио и поможет на собеседованиях. Поэтому мы запускаем новую рубрику с мини-кейсами по ML, которые можно решать вместе с нами. Все посты можно будет посмотреть по тэгу: #петпроект_MLinside

Первая задача: предсказание цен на недвижимость.

Это классика для Data Scientist и отличное упражнение, чтобы потренировать базовые навыки.

Что предстоит сделать:

  • Использовать признаки: площадь, количество комнат, этаж, район, расстояние до центра
  • Закодировать категориальные переменные (например, OHE или target encoding)
  • Обучить модель: линейную регрессия, случайный лес, бустинг
  • Оценить качество: RMSE, MAE, MAPE

Данные можно взять на Kaggle: https://www.kaggle.com/c/house-prices-advanced-regression-techniques. Эта задачка похожа на то, что нужно будет делать ML-инженеру: банки, страховые компании и маркетплейсы решают подобные кейсы каждый день. Сделав эту задачку, вы сможете показать, что умеете мыслить как ML-специалист и писать работающий код.

Готовы попробовать? Делитесь своими результатами в комментариях.