39 подписчиков
Учимся на практике: решаем реальные ML-задачки
Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях.
Четырнадцатая задача
Что нужно сделать: По разным параметрам сделать классификатор уволится человек с работы или нет (переменная attrition)
Как можно сделать:
▪️Обучить классификатор на всех данных
▪️Определить при каких значениях разных переменных человек с большой вероятностью уволится. Определить топ 5 для каждого уровня образования, посмотреть насколько этот топ меняется
▪️Определить насколько важен ворк/лайф баланс
▪️Обучить свой классификатор увольнения для каждого значения переменной PerformanceRating, изменился ли топ 5 значимых переменных в этих классификатор по сравнению с топ 5 у общей модели
▪️или сделать что-то другое
Данные можно взять на Kaggle: www.kaggle.com/...set
Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing
Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
Около минуты
14 июня