Как управлять LLM через язык (prompt engineering) остаётся черным ящиком. Авторы предложили строгий фреймворк через Shapley-значения для количественного измерения влияния отдельных прилагательных на производительность модели. Тестировали 100 прилагательных на 5 архитектурах (o3, gpt-4o-mini, phi-3, llama-3-70b, deepseek-r1) на MMLU-бенчмарке. Ключевые находки: (1) малое подмножество прилагательных работает как мощные "рычаги" управления; (2) эффект не универсален, модели одной линии (e.g., семейство GPT) реагируют коррелированно, архитектурно разные модели независимо; (3) направление эффекта зависит от синтаксического места в промпте; (4) в больших моделях (o3, gpt-4o) появляются неаддитивные взаимодействия, где одно прилагательное может усилить, ослабить или обратить эффект другого. Ред.: Сто прилагательных через Shapley-значения, и главный вывод почти философский: одно и то же слово в разных моделях значит разное. Prompt engineering часто полагается на анекдотичные хвосты ("be precis
Управление языком в LLM: почему прилагательные работают по-разному на разных моделях
СегодняСегодня
1
3 мин