39 подписчиков
Учимся на практике: решаем реальные ML-задачки
Продолжаем рубрику #петпроект_MLinside – тут мы публикуем задачи из реальных (ну или почти реальных) проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях.
Тринадцатая задача
Что нужно сделать: посмотреть на исторические данные об Олимпийских играх, найти зависимости и тренды
Как можно сделать:
▪️Определить топ 5 стран с наибольшим количеством уникальных спортсменов в первый год за который есть данные и за последний, построить графики количества спортсменов для этих стран в зависимости от года
▪️Разделить данные на летние и зимние игры, затем сделать действия из прошлого пункта, изменился ли топ и графики?
▪️Определить максимальное количество золотых и любых медалей завоеванных одним и тем же человеком
▪️Определить для каждого года количество спортсменов которые начали выступать за другую страну
▪️Определить у какого спорта меньше всего уникальных человек завоевывали медали
▪️и т.д.
Данные можно взять на Kaggle: www.kaggle.com/...lts
Пример ноутбука (с случайными пропусками строк): colab.research.google.com/...ing
Готовы попробовать? Делитесь своими результатами в комментариях. А другие посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 минута
31 мая