48 тыс подписчиков

Исследователи впервые «вскрыли мозг» ИИ и поняли, как на него можно влиять

Команда Anthropic сообщила о значительном прорыве в понимании «мышления» ИИ-моделей. Исследователи сопоставили паттерны нейронных активаций большой языковой модели Claude Sonnet с человеческими понятиями. В результате были созданы «концептуальные карты», отображающие связи между идеями в ИИ. В том числе вредными, например, расизма и обмана. Ученые даже смогли подавлять или усиливать определенные концепции, влияя на поведение ИИ. OpenAI, между тем, обнаружила 16 млн «мысленных» шаблонов в GPT-4. Впрочем, специалисты признают, что полностью постичь природу искусственного разума пока невозможно.

https://hightech.plus/2024/06/20/issledovateli-vpervie-vskrili-mozg-ii-i-ponyali-kak-na-nego-mozhno-vliyat

Исследователи впервые «вскрыли мозг» ИИ и поняли, как на него можно влиять Команда Anthropic сообщила о значительном прорыве в понимании «мышления» ИИ-моделей.

Около минуты

20 июня 2024