) Anthropic выложила обновлённую “конституцию” Claude - документ, который задаёт ценности и поведение модели. Это не просто PR: такие принципы реально используются при обучении, чтобы Claude действовал предсказуемо в сложных ситуациях. Вот самое важное: 1) Это больше не список запретов, а логика мышления Раньше конституция больше походила на набор правил. Теперь идея другая: модель должна понимать “почему так”, а не просто следовать инструкциям. Иначе она будет ломаться в нестандартных кейсах. 2) Жёстко прописан порядок приоритетов Anthropic прямо фиксирует, что важнее всего для Claude (по убыванию): - безопасность - этичность - следование политике Anthropic - полезность “Быть полезным” для модели - важно, но никогда не ценой безопасности. 3) Есть неснимаемые запреты (hard constraints) Один из ключевых моментов: одних принципов недостаточно. В самых рискованных темах у модели есть жёсткие линии - например, она не должна усиливать опасные направления вроде создания биологического
📜 Anthropic опубликовала “новую конституцию” Claude - самое интересное (и зачем это нужно
21 января21 янв
7
1 мин