Найти тему
Машинное обучение

🏆 Площадки для решения конкурсов по машинному обучению.

✔️ Kaggle — самая известная площадка для проведения конкурсов по машинному обучению. Там проходят как большие соревнования от известных компаний с большими призовыми, так и обучающие соревнования для тренировки навыков машинного обучения. В kaggle есть встроенный jupyter notebook (а-ля google colab), где можно запускать код (даже если вы не участвуете в соревнованиях). В соревнованиях есть обсуждения участников и публично доступные примеры решения задач — код, который выкладывают другие участники. Отлично, чтобы изучить, как другие люди решают задачи и прокачать навыки.

Также на kaggle есть раздел датасеты, в котором представлены много открытых датасетов для разных задач. Удобно, когда нужно найти датасет для создания своего пет-проекта или просто потренироваться в ML.

Однако конкурсы на kaggle, в которых есть призовой фонд — довольно сложные. 99% из них не подходят для новичков, шанс победить в них довольно мал. Если вы новичок и хотите бороться за призы в конкурсах, присмотритесь к следующим платформам:

✔️ boosters.pro — российская платформа для проведения соревнований по машинному обучению в странах восточной Европы. Сейчас тут нет активных компетишенов, но они иногда появляются. Они проще, чем на kaggle, и в них реально бороться за призы, не затрачивая на это все свободное время.

✔️ competitions.codalab.org — международная платформа для проведения соревнований. Тут часто проводят соревнования не очень крупные компании (те, которые не идут на kaggle). 

✔️ All Cups — платформа для соревнований от Mail.ru. Здесь соревнования не только по мл — еще и по программированию, системному администрированию и созданию игровых ботов. Конкурсы бывают не только от Mail.ru, но и от партнеров. Уровень задач позволяет участвовать в них, не имея огромного опыта решения задач. Для совсем новичков есть песочница — тренировочные задачи. 

У All Cups есть целое сообщество, привязанное к конкурсам, где люди общаются и обмениваются опытом. Вот сообщество VK, плюс у каждого трека (ML, программирование и т.д.) есть свои чаты в телеграме. Это отличная возможность влиться в тусовку и получить опыт решения задач.

✔️ Data Science Works — новая платформа для решения конкурсов по ML от Сбера. Пока функционал платформы небольшой: создание и проведение чемпионатов. Думаю, скоро появятся сообщество и другие функции а-ля встроенного колаба. 

На платформе уже есть анонс первого конкурса: моделирования предпочтений покупателей продуктов. Конкурс стартует 30 ноября. Кажется, конкурсы на этой платформе тоже будут доступны новичкам и не-профессионалам.

Платформы для решения конкурсов по машинному обучению, часть 2.

Первая часть подборки — тут.

#learning

Эта часть подборки появилась благодаря комментариям к посту с первой частью. Спасибо вам!

✔️ Drivendata. Англоязычная платформа типа Kaggle. На ней в основном средней и высокой сложности задачи с призовыми. Есть задачи от Facebook AI, к примеру. Есть текущее соревнование с призовыми в $20.000

✔️ Zindi.Africa. Тоже платформа с соревнованиями по машинному обучению. Насколько я помню из своего общения с коммьюнити ML, многие участвуют тут в соревнованиях и даже выигрывают призовые. Думаю, подойдет для около-новичков, которые начинают пробовать себя в реальных соревнованиях.

Кроме соревнований на сайте есть еще много полезного: форум, карьерный хаб и обучающие материалы. Не знаю, насколько полезен будет карьерный хаб — работу там предлагают в основном в Азии и в Африке; а вот в обучающих материалах можно найти много полезного. Там — куча сатей и туториалов по всем аспектам data science, начиная с того, как пользоваться колабом и обучать BERT до советов по поиску работы и карьере. Также есть отдельный сборник с историям победителей соревнований: хорошая возможность перенять опыт.

✔️ AI Crowd. Здесь тоже соревнования мид- и хард- сегмента с призовыми, как и в Drivendata. Среди хостов — известные организации вроде OpenAI, Facebook AI Research (FAIR), Berkley, Amazon. Тематика задач очень обширна: тут есть много конкурсов по RL, и по всем другим аспектам DL (сегментация, детекция, etc.). Также есть блог, где можно развиваться и делиться опытом.

✔️ Machine Hack. Это скорее обучающий хаб, чем полноценная платформа для соревнований. Тут есть обучающие мини-курсы для самых маленьких начинающих в ML, задачи на проверку свои умений и обучающие соревнования (они называются хакатонами). На них указано, на какой уровень подойдет соревнование.

✔️ Календарь соревнований ODS. Как я писала в первой части подборки, некоторые компании и конференции проводят свои собственные интересные конкурсы, не привязанные к платформам. Чтобы было проще отслеживать множество конкурсов, которые проводятся в куче разных мест, в коммьюнити Open Data Science завели Календарь соревнований . Очень удобно: сразу показаны название, тип данных (CV/NLP/...), призовые и длительность. 

Добавлю так же, что иногда конкурсы по ML проводятся в отрыве от платформ, а привязаны к конференциям. Такие конкурсы нужно отслеживать отдельно. Хорошим началом будет вступление в какое-нибудь ML-сообщество, где люди интересуются конкурсами и мониторят их.

DLStories | Нейронные сети и ИИ

Машинное обучение RU

Если хотите что-то добавить, пишите в комментарии ⬇️

#machinelearning #artificialintelligence #ai #datascience #python #programming #technology #deeplearning #coding