Реальность наносит ответный удар: почему хваленый ИИ набирает 0% в новом бенчмарке