2306 подписчиков
Новое исследование от Google DeepMind представляет Michelangelo — новую систему оценки способностей больших языковых моделей к долгосрочному контекстному рассуждению.
Система, называемая Latent Structure Queries (LSQ), направлена на тестирование способности моделей синтезировать информацию из обширных контекстов, а не просто извлекать ее.
Исследование показывает, что существующие бенчмарки часто фокусируются на задачах извлечения, которые не в полной мере измеряют способность модели к синтезу информации в больших контекстах. Michelangelo преодолевает эти ограничения, требуя от моделей понимания и манипулирования латентными структурами в контексте.
#FREEDUROV
Около минуты
21 сентября