Российские специалисты из SberAI, НИУ ВШЭ, Института искусственного интеллекта AIRI и МФТИ создали первый всесторонний тест для оценки того, как большие языковые модели справляются с длинными русскоязычными текстами. Об этом сообщили в Центре научной коммуникации МФТИ. Инициаторы проекта отмечают, что многие современные ИИ‑системы ограничены объёмом так называемого контекстного окна и при работе с длинными текстами «забывают» ранее прочитанные части. При этом архитектуры новых моделей уже позволяют обрабатывать массивы, сопоставимые по размеру с крупными статьями и книгами, но стандартизированного инструмента для оценки этих возможностей не было. Новый тест представляет собой набор из 18 заданий, рассчитанных на тексты длиной от 4 до 128 тыс. структурных элементов. Модели должны искать и извлекать конкретные фразы, отвечать на содержательные вопросы, объединять разрозненные сведения из разных частей документа и решать сформулированные в тексте задачи. Команда уже опробовала инструмент
В России разработали «экзамен» для ИИ на работу с длинными текстами
1 декабря 20251 дек 2025
9
1 мин