Найти тему
2306 подписчиков

Новое исследование от Google DeepMind представляет Michelangelo — новую систему оценки способностей больших языковых моделей к долгосрочному контекстному рассуждению.


Система, называемая Latent Structure Queries (LSQ), направлена на тестирование способности моделей синтезировать информацию из обширных контекстов, а не просто извлекать ее.

Исследование показывает, что существующие бенчмарки часто фокусируются на задачах извлечения, которые не в полной мере измеряют способность модели к синтезу информации в больших контекстах. Michelangelo преодолевает эти ограничения, требуя от моделей понимания и манипулирования латентными структурами в контексте.



#FREEDUROV
Новое исследование от Google DeepMind представляет Michelangelo — новую систему оценки способностей больших языковых моделей к долгосрочному контекстному рассуждению.
Около минуты