Мы собрали более 1,2 миллиона задач по олимпиадной математике за 2024‑2025 годы, чтобы обучить модели искусственного интеллекта решать сложные задачи и генерировать новые тренировочные материалы. Этот датасет уже используется в проектах, где AI помогает ученикам готовиться к соревнованиям, а также в исследовательских целях. Отбор начался с анализа открытых репозиториев и школьных архивов, где было найдено более 2,5 млн задач. Затем мы применили фильтры по уровню сложности и актуальности, оставив только задачи, соответствующие требованиям международных олимпиад 2023‑2025 гг. Русскоязычные задачи позволяют моделям лучше понимать специфику формулировок и терминологии, используемой в российских олимпиадах. Это повышает точность решения на 15 % по сравнению с англоязычными аналогами. Для доступа к датасету достаточно зарегистрироваться на нашем портале и скачать готовый архив в формате JSON. Мы также предоставляем API‑ключ для интеграции в ваши проекты. Модели, обученные на нашем датасете,
Как собрать датасет олимпиадной математики и зачем это нужно AI
13 апреля13 апр
1
2 мин