Продолжаем разбирать руководство Google по ИИ-Агентам (Часть 1 - Агенты, Часть 2 - Инструменты, Часть 3 - Память). Если прошлые части были про создание, то эта - про то, как не сойти с ума при тестировании. ▶️ Что такое Качество Агента? Традиционное ПО детерминировано (вход А всегда дает выход Б). Агенты - вероятностны. Они "думают", планируют и могут выбирать разные пути решения одной задачи.
Традиционный тестировщик спрашивает: "Мы собрали продукт правильно?" (по спецификации).
Оценщик Агента спрашивает: "Мы собрали правильный продукт?" (решает ли он задачу пользователя).
Аналогия от Google: Линейный повар vs Шеф-повар.
Традиционный софт - это линейный повар в фастфуде. У него есть жесткая инструкция: жарить котлету 90 секунд, положить один ломтик сыра. Мониторинг здесь - это просто чек-лист.
ИИ-Агент - это шеф-повар на кулинарном шоу с "черным ящиком". Ему дают цель ("сделай вкусно") и набор продуктов (инструменты, данные). Единого рецепта нет. Чтобы оценить его работу, недос