Исследователи из России разработали первый комплексный инструмент для оценки того, как большие языковые модели обрабатывают длинные тексты на русском языке. Разработка представлена на конференции EMNLP 2025 в Сучжоу, сообщили в Центре научной коммуникации МФТИ. По словам исследователя МФТИ Айдара Булатова, до сих пор у российских команд не было единого «секундомера» для проверки качества работы ИИ с большими объёмами текста. Каждый разработчик использовал собственные методики, что затрудняло сравнение моделей. Новый тест призван стать открытой площадкой, на которой любые команды могут в единых условиях оценивать производительность своих систем. Авторы отмечают, что одной из уязвимостей современных языковых моделей остаётся работа с длинными документами: при превышении размера контекстного окна алгоритмы теряют часть ранее прочитанной информации и опираются только на последние абзацы. Хотя архитектуры моделей уже модифицируют так, чтобы обрабатывать тексты, сопоставимые по объёму с книг
Российские учёные создали тест для ИИ на понимание длинных текстов
1 декабря 20251 дек 2025
1
1 мин