Найти в Дзене
39 подписчиков

Учимся на практике: решаем реальные ML-задачки


Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях.

Четырнадцатая задача

Что нужно сделать: По разным параметрам сделать классификатор уволится человек с работы или нет (переменная attrition)

Как можно сделать:
▪️Обучить классификатор на всех данных
▪️Определить при каких значениях разных переменных человек с большой вероятностью уволится. Определить топ 5 для каждого уровня образования, посмотреть насколько этот топ меняется
▪️Определить насколько важен ворк/лайф баланс
▪️Обучить свой классификатор увольнения для каждого значения переменной PerformanceRating, изменился ли топ 5 значимых переменных в этих классификатор по сравнению с топ 5 у общей модели
▪️или сделать что-то другое

Данные можно взять на Kaggle: www.kaggle.com/...set

Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing

Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
Учимся на практике: решаем реальные ML-задачки  Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию.
Около минуты