Исследователи пытаются понять, как работают большие языковые модели

Джош Батсон из стартапа Anthropic отмечает, что модели скорее "вырастают", чем проектируются.IT-World
Механистическая интерпретация, или понимание внутренних процессов моделей, стала целью многих исследователей.IT-World
Также возможно изменять поведение модели, манипулируя отдельными признаками.IT-World
В другом исследовании, команда из Оксфорда под руководством Себастьяна Фарквара использовала меру "семантической энтропии" для оценки вероятности галлюцинаций.IT-World