Google запускает Vibe Checker для оценки ИИ-кода по-новому Новое исследование Google DeepMind и нескольких американских университетов показало, что большинство тестов для проверки кода, созданного ИИ, не соответствуют тому, что действительно важно разработчикам. Вместо оценки, работает ли код, система Vibe Checker также проверяет, насколько код следует подробным инструкциям. Исследователи выяснили, что совмещение проверки работоспособности и следования инструкциям даёт результаты, которые существенно ближе к человеческим предпочтениям. Проблема в… Подробнее
Google запускает Vibe Checker для оценки ИИ-кода по-новому
11 октября 202511 окт 2025
~1 мин