Найти в Дзене
Блохи в свитере

Российские учёные научились читать мысли ИИ и управлять ими без переобучения с помощью метода SAE Match для управления языковыми моделями

Российские учёные научились читать мысли ИИ и управлять ими без переобучения с помощью метода SAE Match для управления языковыми моделями.

Система строит так называемый граф потока признаков, отслеживающий, как внутри модели формируются, трансформируются и исчезают элементы смысла. В отличие от прежних методов, анализ теперь ведётся не только между слоями, но и между модулями внимания и логики, чтобы понять, использует ли модель информацию из контекста или из своих внутренних знаний.

Новый подход позволяет изменять стиль, тему или тональность текста без изменения параметров модели. При этом, не требует дополнительных данных и работает с уже обученными моделями.