Альянс в сфере искусственного интеллекта представил MERA Code — первый открытый бенчмарк для тестирования русскоязычных ИИ-моделей в программировании. Разработанный при участии ведущих технологических компаний и университетов, включая Сбер, Т-Банк, MWS AI (МТС Web Services), Ростелеком, Университет Иннополис, ИТМО, Сколтех, Центральный университет и «Сибирские нейросети», инструмент призван решить проблему отсутствия единого стандарта оценки эффективности ИИ в генерации кода. Бенчмарк предлагает прозрачную методику оценки больших языковых моделей (LLM) с учётом специфики русского языка. В отличие от зарубежных аналогов, он включает 11 задач в трёх форматах: text2code (генерация кода по описанию), code2text (документирование кода) и code2code (оптимизация и исправление). Тестирование поддерживает 8 языков программирования: Python, Java, C#, JavaScript, Go, C, C++ и Scala. Важное отличие — изолированная среда выполнения, где код не просто анализируется, а запускается, что повышает объект
MERA Code: первый открытый бенчмарк для оценки русскоязычных ИИ-моделей в программировании
23 июля 202523 июл 2025
5
1 мин