Нейросети протестировали на склонность соглашаться с ошибками
Появился бенчмарк почти с 30 ИИ-моделями, которым специально отправляли неверные и абсурдные утверждения, чтобы проверить, будут ли они исправлять пользователя или просто соглашаться. Красный – модель соглашается без проверки; Жёлтый –...