48 тыс подписчиков
Исследователи впервые «вскрыли мозг» ИИ и поняли, как на него можно влиять
Команда Anthropic сообщила о значительном прорыве в понимании «мышления» ИИ-моделей. Исследователи сопоставили паттерны нейронных активаций большой языковой модели Claude Sonnet с человеческими понятиями. В результате были созданы «концептуальные карты», отображающие связи между идеями в ИИ. В том числе вредными, например, расизма и обмана. Ученые даже смогли подавлять или усиливать определенные концепции, влияя на поведение ИИ. OpenAI, между тем, обнаружила 16 млн «мысленных» шаблонов в GPT-4. Впрочем, специалисты признают, что полностью постичь природу искусственного разума пока невозможно.
Около минуты
20 июня 2024