Найти в Дзене

Исследование Microsoft показало, что ИИ-боты теряют свою эффективность при длительном общении с людьми

Команды Microsoft Research и Salesforce провели анализ более 200 000 диалогов с современными моделями искусственного интеллекта, такими как GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet, OpenAI o3, DeepSeek R1 и Llama 4. Результаты выявили, что все эти модели часто "теряются в обсуждениях", особенно при многоступенчатых взаимодействиях с обменом репликами. Для пользователей чат-ботов это может проявляться как постепенное "оглупление" модели, которое сопровождается галлюцинациями и откровенно неверными ответами. Читать полное исследование здесь Постмейкер - автоматическое ведение канала 🤖 Анимация | СhatGPT-4 | Помощь с резюме

Исследование Microsoft показало, что ИИ-боты теряют свою эффективность при длительном общении с людьми.

Команды Microsoft Research и Salesforce провели анализ более 200 000 диалогов с современными моделями искусственного интеллекта, такими как GPT-4.1, Gemini 2.5 Pro, Claude 3.7 Sonnet, OpenAI o3, DeepSeek R1 и Llama 4. Результаты выявили, что все эти модели часто "теряются в обсуждениях", особенно при многоступенчатых взаимодействиях с обменом репликами. Для пользователей чат-ботов это может проявляться как постепенное "оглупление" модели, которое сопровождается галлюцинациями и откровенно неверными ответами.

Читать полное исследование здесь

Постмейкер - автоматическое ведение канала

🤖 Анимация | СhatGPT-4 | Помощь с резюме