Найти в Дзене
Николаев

просидел 2 месяца в google antigravity (редактор кода от гугла с ai агентами

) из них месяц на самом дорогом плане ai ultra (по факту безлимитное количество токенов на Gemini 3 pro и Claude Opus 4.5 за ~25к, если на рубли перевести) суммарно, наверное часов 400 чистого времени много что есть рассказать, уж не знаю насколько вам будет интересно но пока главный вывод такой: когда читаю/слышу что агенты сами по плану реализуют все, тебе только тз поставь да спек одобри, угораю люто через 1-2 коммита в сессии агентам вообще срать на ваши системные правила, системные промпты, воркфлоу, mcp серверы и правила написанные в них, agent.md, архитектурные планы и спеки и всю мешуру, которой вы пытаетесь заставить работать их правильно, начитавшись топовых авторов про ии реально, им просто похуй причем похуй даже на системные таски с чекбоксами и планы имплементации. Они просто хуй кладут сразу же, как только контекстное окного агента сжимается из-за объема сообщений в чате (а наступает это ОЧЕНЬ быстро, согласно логам). Потом они делают что хотят, по стандартам 202

просидел 2 месяца в google antigravity (редактор кода от гугла с ai агентами)

из них месяц на самом дорогом плане ai ultra (по факту безлимитное количество токенов на Gemini 3 pro и Claude Opus 4.5 за ~25к, если на рубли перевести)

суммарно, наверное часов 400 чистого времени

много что есть рассказать, уж не знаю насколько вам будет интересно

но пока главный вывод такой:

когда читаю/слышу что агенты сами по плану реализуют все, тебе только тз поставь да спек одобри, угораю люто

через 1-2 коммита в сессии агентам вообще срать на ваши системные правила, системные промпты, воркфлоу, mcp серверы и правила написанные в них, agent.md, архитектурные планы и спеки и всю мешуру, которой вы пытаетесь заставить работать их правильно, начитавшись топовых авторов про ии

реально, им просто похуй

причем похуй даже на системные таски с чекбоксами и планы имплементации. Они просто хуй кладут сразу же, как только контекстное окного агента сжимается из-за объема сообщений в чате (а наступает это ОЧЕНЬ быстро, согласно логам). Потом они делают что хотят, по стандартам 2024 - начала 25 года (данные по которым они обучались), внедряют легаси либы, пишут кривые реализации, забывают даже текущий скоуп, неговоря о всей системе

а это, на минуточку, топовая мультиагентная система от гугла, с топовыми моделями под копотом в качестве рук

я не знаю как там claude code, который очень хвалят, но предположу, что так же

Единственное, что ДЕЙСТВИТЕЛЬНО работает у меня (театральная пауза и барабанная дробь) — старые добрые тесты и TDD )) причем я довел дело до абсурда и написал enforecement тесты НА ТЕСТЫ, и на архитектуру

то есть тесты, которые на уровне системы не дают работать дальше, если агент/модель написал не так, как надо написать. Или положил файл туда, куда не надо класть. Или назвал файл/метод не так, как требует энфорсмент тест. Или написал тест не так, как энфорсмент_тест тесте

make check (или что там у вас в проекте) фейлится на тесте, агент идет смотреть почему, попадает в цикл исправления бага согласно энфорсмент тестам, пока не исправит, дальше не делает ничего

все

теперь я сижу и пью чай, наблюдая как агенты в ахуе ходят по циклу, пока не сделают то и так, как я хочу)

остальное — пиздеж для видосов на ютубе и постов в телеграме для продажи курсов

не слушайте никого, думайте головой, любите сердцем)