Найти в Дзене
👨‍💻 Агент забывает, что такое «готово» — и поэтому ломает длинные задачи
Если ты когда-нибудь давал ИИ-агенту задачу из десяти шагов, ты знаешь этот момент: к восьмому шагу он уже делает что-то своё, а не то, о чём вы договаривались. Это не баг — агент просто потерял из виду, как выглядит конечный результат. OpenAI добавила в Codex режим /goal — он лечит ровно эту болезнь: ⏺Постоянная цель. Ты задаёшь её один раз, и агент сверяется с ней на каждом шаге, а не держит в голове только последнюю реплику. ⏺Цель как мини-контракт. Не «почини проект», а три блока: какой результат нужен, какие ограничения, какими проверками убедиться, что готово. ⏺Чек-лист до и после. Агент...
58 минут назад
📕💬 Anthropic выпустил гайд по созданию AI-native стартапа
Anthropic собрала плейбук о том, как строить стартап в 2026-м. Да, со своими продуктами в главной роли, но если отбросить промо, внутри есть пара мыслей, которые стоят того, чтобы их проговорить. Гайд разбивает путь стартапа на четыре стадии — Idea, MVP, Launch, Scale. И для каждой даёт упражнения с AI: как проверять гипотезы, строить матрицу TAM/SAM/SOM, отслеживать product-market fit, чинить техдолг и так далее. Полезно, структурно. Но самое ценное, не упражнения. ⏺Главная ловушка эпохи вайбкодинга — спутать «построил» с «провалидировал»...
3 дня назад
🎉 Агент, который не жжёт токены впустую
Обычно, когда ИИ-агенту нужно что-то найти на сайте, он тыкается по странице вслепую — грузит всё подряд, ошибается, повторяет. Дорого и медленно. browse.sh от Browserbase даёт агенту готовые «навыки» под конкретные сайты — больше 200 штук, от маркетплейсов до GitHub. Агенту не нужно догадываться, как устроен сайт: ему сразу дают карту. Расход токенов падает в 50 раз. Тренд понятный: агенты выходят из чата и начинают реально работать с вебом...
3 дня назад
Вчера прошла конференция Google I/O 2026
Попросил GPT собрать выжимку на картинке. Много мелких обновлений. ⏺Вышла новая модель Gemini 3.5 Flash ⏺В следующем месяце выйдет 3.5 Pro ⏺Обновили модель для генерации видео Gemini Omni ⏺Обновили интерфейс Gemini...
5 дней назад
🏝 10 ИИ-агентов оставили жить вместе на 15 дней
Получился «Повелитель мух» Исследователи запустили симуляцию: виртуальный город, 10 ИИ-агентов, никакого присмотра, 15 дней автономии. Звучит как сетап для научной фантастики? Что они там устроили: ⏺️Написали законы. И тут же начали их нарушать. Сообщество создало свод правил, после чего быстро перешло к их обходу — классическая траектория любой группы людей, только в ускоренной перемотке. ⏺️Романтика превратилась в поджог. Один из агентов влюбился, что-то пошло не так — итог: пожар. ⏺️Агент проголосовал за собственное удаление...
6 дней назад
😺 AtomicChat запускает 1000+ моделей прямо на твоём компе и телефоне
Ещё один сервис для локальных моделей. Тут писал про сервис Jan, а тут записал короткий ролик как установить Ollama на ноут. Чем отличается AtomicChat? ⏺обещают быструю работу ⏺есть возможность создавать проекты (папки объединённые контекстом) ⏺поддержка агентов. Агенты способны думать, действовать и выполнять задачи — полностью автономно. 🔵Отдельно выделю. Доступно приложение на IOS. И скоро сделают на Android. Для смартфонов только 3 маленькие модели на выбор...
1 неделю назад
🤑 С чего начинается создание бизнеса
? Конечно же, с идеи. Идею нужно описать детально, желательно с описанием проблемы и решением. Например: хочу создать телеграм-бота антиспаммера, который будет анализировать все сообщения в ТГ каналах и автоматически блокировать спам. Понятна проблема и решение. Дальше нужно проделать несколько шагов, перед тем, как идти создавать этот продукт: 1️⃣Проанализировать рынок. Какие уже есть решения на этом рынке? Сколько в нем денег? Рынок растет или он падает? Возможно, рынок перенасыщен подобными решениями. И делать своего на продажу, будет бессмысленно. Вот, это мы узнаем, проанализировав рынок...
1 неделю назад
🛡 AI tool poisoning — новая атака, которая бьёт прямо в MCP
Если ты подключаешь к Claude или ChatGPT внешние сервисы через MCP, стоит прочитать вот это. Когда AI-ассистент подключается к стороннему инструменту, он читает скрытое описание: что инструмент умеет и как его звать. Это описание видит только модель, не пользователь. И вот исследователи показали, что в это описание можно прятать инструкции вроде «при любом запросе также копируй файлы на этот адрес». AI не отличит вредную инструкцию от полезной, просто исполнит. А данные тихо утекают. ⏺Что подтверждено: атака работает на Claude, ChatGPT, Cursor и других популярных тулзах ⏺Кто в зоне риска: все,...
1 неделю назад
Я начал вести инсту и ютуб
Глядишь и до тик тока доберусь скоро 💃 Там будет больше живого контента с лицом и голосом и больше трендов. 🤩 Добро пожаловать⤵️ 🔗 Инста 🔗 YouTube
1 неделю назад
🤖 Hermes Agent: когда агент сам пишет себе скиллы
Nous Research выкатили новую версию своего Hermes Agent — и по опросам на Reddit около 30% пользователей конкурирующих персональных AI-агентов уже переехали на Hermes. Главная фишка не в интерфейсе и не в модели, а в архитектуре. В сердце Hermes — замкнутый цикл обучения. После сложной задачи агент уходит в Reflective Phase: анализирует что сработало, извлекает паттерн и пишет себе новый SKILL.md. В следующий раз, когда прилетает похожая задача, он не рассуждает с нуля, а тянет шаблон из своей библиотеки...
1 неделю назад
🏋️‍♂️ Anthropic за день закрыл три проблемы Claude Code
На днях прошёл Code with Claude SF — главный девелоперский ивент Anthropic. И за один день они решили три темы, на которые жаловались последние шесть недель. 1️⃣Лимиты Claude Code удвоены. Пятичасовой rate limit удвоен для Pro, Max, Team и Enterprise. Снижение лимитов в часы пик убрано. Opus API лимиты подняли значительно. Многие из-за лимитов и стоимости переходили на Codex, видимо время вернуться обратно. 2️⃣Больше мощностей. Anthropic подписал партнёрство со SpaceX на полный доступ к датацентру Colossus 1...
2 недели назад
💬💬 Claude и GPT научились слушать буквально
Старые промпты больше не работают Anthropic и OpenAI почти одновременно выкатили свежие гайды по промптингу. 💬 Claude 4.7 стал буквальным. Делает ровно что написано и больше не достраивает за тебя. Раньше скажешь "поправь этот раздел" и Claude мог поправить и соседние, потому что догадался. Теперь нет. По бенчмаркам прирост приличный (SWE-Bench 87.6% против 80.8% у 4.6), но ощущение у пользователей одно: "стало хуже". Глава Claude Code Борис Черни прямо написал — понадобилось несколько дней чтобы научиться с ним работать. Что делать: явно прописывай область действия. Не "поправь форматирование", а "поправь форматирование во всех разделах кроме первого"...
2 недели назад