Механистическая интерпретируемость пытается разобраться в том, как работают большие языковые модели (LLM). В статье предлагается гибридная квантово-классическая система Quantum Sieve Tracer для анализа схем фактического запоминания. Исследование показывает различия в архитектуре двух моделей: Qwen и Llama, выделяя механизмы запоминания и подавления помех. arXiv: 2602.06852 Обзоры | Квантовая физика
Квантовое Сиево Трасер: Гибридная структура для послойного отслеживания активации в больших языковых моделях
9 февраля9 фев
~1 мин