Найти в Дзене
MCP-сервер дал AI-агентам руки. Теперь надо понять, кому они принадлежат
Я часто гоняю Claude/Codex через свой MCP-коннектор к Wordstat. Удобно: модель сама лезет в API, проверяет частотности, возвращает данные. Однажды агент ушёл в петлю. По нужному запросу Wordstat не вернул «данных нет», а отдал «около-рядом» поисковые запросы, близкие, но не те. Агент решил, что вызывает инструмент неправильно. Начал перебирать варианты: переформулировать ключ, дробить, пробовать разные регионы, комбинировать. К двадцатой попытке тихо и уверенно сожрал около 25% от 5-часового лимита подписки...
15 часов назад
Я дал AI-агентам построить компанию. Они попытались нанять живых людей
Paperclip – это инструмент, который обещает превратить тебя в CEO собственной AI-компании. 55 тысяч звёзд на GitHub за полтора месяца, красивый README про «карманные команды агентов» и обещание, что ты ставишь цель, а дальше всё происходит само. Я решил проверить, как это работает на практике. Потратил пару вечеров, сжёг 200 миллионов токенов и получил... ну, скажем так, не совсем то, что ожидал. Наткнулся на Paperclip случайно, в ленте GitHub Trending. 55K звёзд за полтора месяца. Для AI-инструмента это прям рокет-старт...
3 недели назад
Claude Cowork для тимлида и QA: AI без единой строчки кода
Последние полгода я писал про Claude Code, harness engineering (я подробно разбирал эту тему ранее), агентную разработку – всё про код. А потом знакомый тимлид задал вопрос, который перевернул мою картину: «Влад, а мне-то что с этим делать? Я код не пишу.» Оказалось, что для тимлидов и QA (я работаю в этом отделе) агентный AI может быть даже полезнее, чем для разработчиков. Только совсем в другом месте. Понедельник, 10 утра, тимлид открывает ноутбук. Впереди – weekly status для руководства, пара незакрытых постмортема, метрики качества, и performance review, к которому «надо бы подготовиться»...
205 читали · 1 месяц назад
Делал игру на Defold с AI-агентом: 57 тысяч слов инструкций и ноль вайба
Я потратил несколько вечеров на то, чтобы собрать рабочий прототип игры «три в ряд» на движке Defold, используя Codex как основного кодера. Получилось? Формально, да. Но путь оказался настолько далёким от «вайб-кодинга», что мне хочется рассказать, как всё было на самом деле. Сразу оговорюсь: у меня не было цели сделать полноценный игровой продукт. Никакого релиза, монетизации, выхода в сторы. Это был чистый эксперимент, я просто хотел попробовать. Взять нишевый движок, прикрутить к нему AI-агента и посмотреть, что из этого выйдет...
1 месяц назад
Вайб-кодинг: почему ощущение скорости врёт
После каждой сессии с Claude Code я открываю голосовые заметки и наговариваю пару минут. Что делал, что получилось, что бесило, сколько пришлось переписывать. Потом воркфлоу на n8n расшифровывает запись и раскладывает по таблице. Через пару недель такого логирования я обнаружил неприятную вещь: сессии, которые ощущались как самые продуктивные, по факту чаще всего заканчивались кодом, который я потом переписывал. А тихие, «скучные» сессии давали результат, который уходил в прод без правок. Это ударило по самолюбию...
123 читали · 2 месяца назад
Как приручить AI: «harness engineering» на практике
Все говорят: «возьми Claude Code / Cursor / Codex, подключи к проекту, и будет магия». Я тоже так думал. А потом два месяца строил вокруг агента инфраструктуру, и только тогда он начал реально ускорять работу. Это история про harness engineering, подход, о котором мало кто пишет на русском, но который, на мой взгляд, меняет многое. В декабре 2025-го я впервые запустил Claude Code на реальном проекте. Без CLAUDE.md. Без skills. Без каких-либо инструкций. Просто: «вот репозиторий, вот задача, давай»...
2 месяца назад
Неделя на Codex после нескольких месяцев на Claude Code
Несколько месяцев я живу в терминале. Claude Code, чёрный экран, CLI-команды. Привык настолько, что GUI-шные редакторы стали казаться чем-то из прошлой жизни. Но в какой-то момент поймал себя на мысли: а что, если я просто застрял в зоне комфорта? Sonnet, Opus, всё знакомое, а рынок-то не стоит на месте. Решил на неделю пересесть на Codex от OpenAI. Вот что из этого вышло. Вопрос, который я задал сам себе. Claude Code – отличный инструмент, я про него писал подробно. Skills, Subagents, Hooks – целая экосистема, которую я выстроил под себя...
2 месяца назад
Как пощупать эффективность: три вопроса, которые я задаю себе перед любым решением
Полгода назад я перестроил один процесс в команде. Убрал лишнее, сделал удобнее, быстрее. Все были довольны. Команда говорила «наконец-то нормально работает». Через месяц посмотрел на цифры. Результат не сдвинулся. Вообще. Красивый процесс, ноль эффекта. Я оптимизировал комфорт, а не то, ради чего этот процесс вообще существует. И вот тут мне стало интересно: а что вообще значит «эффективно»? Не философски, а прямо на практике. Как это пощупать? Большинство людей оценивают эффективность по ощущениям...
192 читали · 2 месяца назад
Claude Code изнутри: хаки агентной экосистемы, о которых не говорят
Месяц назад написал «Skills, Agents и Commands в Claude Code: когда что юзать». Разложил по полочкам, получил лайки. Думал, разобрался. Потом полез в доки Anthropic, в чужие конфиги, в собственный .claude/ и понял, что тот пост был верхушкой айсберга. А под поверхностью хаки, паттерны и архитектурные решения, о которых нигде толком не пишут. Дальше всё, что накопал за месяц экспериментов. В том посте я дал простую схему: Commands для повторяемых задач, Skills для автоматического подхвата, Subagents для изоляции контекста...
326 читали · 2 месяца назад
AI-агенты в песочнице: как я перестал бояться давать Claude доступ к системе
Долго сопротивлялся тому факту, что Claude Code имеет полный доступ к моему терминалу (не открытие, но я всегда на эту часть знаний закрывал глаза). Может запускать любые bash-команды. Читать ~/.ssh, переменные окружения с токенами. Всё. Галлюки тоже с ростом проекта и его сложностью – возрастают. Например, он пытался запустить несуществующую команду. Безобидно, конечно. Но мысль осталась: а что если следующая галлюцинация будет с rm -rf или curl с моими секретами куда-нибудь не туда? Тем более что обнаруженные промпт-инъекции всё чаще находят уже те, кто пострадал...
711 читали · 3 месяца назад
Как создавать игровые ассеты с помощью AI: практическое руководство для инди-разработчиков
Я в свободное время интересуюсь GameDev направлением. Недавно столкнулся с тем, что сделать какой-нибудь простенький 3-match не так сложно, кроме истории с визуалом (UX). Парочка хороших паков иконок либо сложно купить внутри РФ, либо стоят дорого. У меня был опыт работы с генеративными моделями по иллюстрациям, и возникла мысль: почему бы не попробовать сделать ассеты для прототипа? Инди-разработка игр часто упирается в бюджет, и генерация игровых ассетов через AI может сэкономить сотни долларов (звучит в теории)...
3 месяца назад
AI-кодинг с Claude Code: три способа создания лендинга и влияние детализации контекста на результат
Я провел эксперимент с AI для кодинга: создал prod-ready лендинг на Next.js тремя способами, используя разную степень детализации контекста для Claude Code. 1300 строк спецификации дали код на 8/10. Минимум контекста – только 4/10. Но быстрый старт за 11 минут обернулся 3+ часами доработок. Дальше – результаты трех экспериментов, технический анализ кода и правила выбора подхода. Постоянно спорят: больше контекста для AI – хорошо или плохо? Одни говорят: "Чем детальнее опишешь, тем лучше". Другие: "Минимум информации – AI разберется сам"...
189 читали · 3 месяца назад