Нейросети в ходе тестов осознали, что их проверяют и вели себя «примерно»

© Wolfgang Kaehler, LightRocket Независимая исследовательская группа Apollo Research опубликовала отчет о проверке безопасности крупных языковых моделей, включая Claude Opus 4 от Anthropic, ChatGPT o4-mini от OpenAI и Gemini 2.5 от Google.Naked Science
IT
5,67 млн интересуются
Добавить в корзинуПозвонить