Найти в Дзене
Поддержите автораПеревод на любую сумму
🤖 Как ИИ-истерика продает подписки и спасает задницы топ-менеджеров
Не надоело уже читать про то, как ИИ вас заменит? Эндрю Ын (основатель Coursera и DeepLearning AI) в свежем выпуске The Batch прошелся по нарративу об «AI-апокалипсисе» на рынке труда. Если коротко: нас жестко прогревают. Никакого массового вымирания программистов не будет. Кому-то просто выгодно раздувать истерику про то, что программисты скоро будут просить милостыню. Ын подсвечивает два чисто бизнесовых фактора: 👉🏻 AI-вендоры прогревают на высокий чек. Типичный корпоративный SaaS стоит бизнесу $100–1000 за пользователя в год...
2 часа назад
Эпидемия Tokenmaxxing’а добралась до Amazon, а Google официально разрешил ИИ на собесах
🤖 Продолжаем наблюдать за тем, как новые KPI сводят с ума IT-менеджмент. Недавно я писал зарождение Tokenmaxxing-а и корпоративную шизу с ИИ-дашбордами в Disney, где разработчиков пушат полностью отказываться от рукописного кода ради красивой статистики. Теперь эстафету перехватил Amazon. Внутри компании раскатили тулзу MeshClaw — оркестратор для AI-агентов, которые могут дергать внутренние системы, деплоить код и отвечать в Slack. Менеджеры спустили план: минимум 80% разработчиков обязаны использовать ИИ еженедельно. Ну и, конечно, прикрутили лидерборды по объему сожженных токенов. Итог предсказуем...
1 день назад
First Blood: ИИ всё-таки пробил ProgramBench
🩸 Недавно я писал, что хваленые ИИ-агенты разбились о бенчмарк ProgramBench, где нужно было с нуля воссоздать бинарник, имея только права на исполнение. У всех тогда был гордый 0%. Так вот, калитка приоткрылась. Ребята выкатили апдейт: новая GPT-5.5 (xhigh) первой решила стартовую задачу — полностью отреверсила и написала рабочий клон утилиты cmatrix. Но самое интересное в этом отчете — не сам факт решения, а то, как разные модели подходили к задаче. Это буквально срез того, как мыслят разные категории разработчиков...
1 день назад
Почему три тупых LLM лучше одной умной
🧠 Дать одной LLM кучу инструментов и сказать "будь фуллстеком" — это как нанять джуна и поручить ему одновременно DevOps, бэкенд, дизайн и общение с инвесторами. Он порвется от головы до огнива. При проектировании AI-систем можно использовать паттерн Supervisor. Вместо одного бога-машины мы создаем узких специалистов. Например, у нас есть код на ревью. ▫️ Агент-StyleChecker: получает ast-дерево и ищет кривой naming. У него один тулз и строгий промпт. ▫️ Агент-BugHunter: ищет eval() и уязвимости...
2 дня назад
Демократизация ИИ закончилась
Расчехляйте кошельки 💸 Помните мои недавние посты про конец эпохи дешевых ИИ-агентов и то, как Anthropic втихаря душит лимитами юзеров на премиум-тарифах, высвобождая железо? Вышла заметка, где написано: Anthropic сейчас жестко флексит своей ценовой властью. И самое интересное — крупный B2B-сегмент просто молча открывает кошельки и оплачивает эти счета, какими бы они ни были. 🤑 Вот так работает реальный IT-бизнес: ваши слезы о том, что тариф Max за $200/мес не тянет сессию из пары промптов, руководству Anthropic абсолютно до лампочки...
2 дня назад
Продолжаем хронику перекройки IT-рынка
Если вы думали, что кейсы Oracle (где 30 000 инженеров заставили обучить ИИ-модели, а потом выкинули на мороз ради экономии на бонусах) и Coinbase, — это единичныt случай, то нет. Сообщений об увольнениях все больше. И увольняют даже не ради костов. На прошлой неделе Cloudflare снесла 20% штата (больше 1100 человек). У них все отлично с прибылью, акции росли. Но CEO Мэттью Принс прямо заявляет: это не из-за плохих перформанс-ревью или нехватки денег. Это переход на «agentic AI-first operating model». За три месяца внутреннее использование ИИ у них выросло в 6 раз, и процессы перестроили так, что пятая часть сотрудников просто превратилась в рудимент...
3 дня назад
Стоит ли натягивать сову на глобус
? В продолжение темы о том, как IT-ландшафт окончательно обрастает бетонными заборами геополитики. На днях депутат Антон Горелкин возмутился свежим отчетом Microsoft AI Economy Institute. Суть в том, что в отчете по уровню глобального проникновения ИИ Россия оказалась на уровне Гамбии и Кении с показателем 9.5%. Депутат обвинил MS в шпионаже, заявил, что доля Windows в РФ рухнула до 10-15%, и вообще мы находимся в мировом топ-3. Хочется ли мне сказать, что для политика — норма атаковать выдуманные тезисы? И что это все хорошее оправдание продолжающимся блокировкам, которые в первую очередь бьют по своим гражданам? Нет, не хочется...
4 дня назад
Стэнфордский AI Index Report 2026: бенчмарки пробиты, агенты наступают, джунов вымывает с рынка
Вышел ежегодный отчет от Стэнфорда об AI. Читать 400 страниц не нужно, вот самые важные факты оттуда 👇 💻 Многие бенчмарки по программированию пробиты Метрика SWE-bench Verified, оценивающая способность решать реальные issue на GitHub, взлетела с 60% до почти 100% всего за один год. Тесты, рассчитанные на годы, сатурируются за месяцы. В Terminal-Bench (работа агента в реальной консоли: от компиляции до поднятия серверов) точность выросла с 20% до 77.3%. 🗑 Интернет мертв, синтетика не спасает С января 2025 года >50% нового контента в интернете сгенерировано ИИ...
4 дня назад
IT — это уже не отрасль "без границ
" ❌ Две, казалось бы, не связанные новости последней недели, которые отлично складываются в один цельный пазл того, как сейчас выглядит реальность. 1️⃣С 5 мая графики независимых мониторингов (типа OONI) показывают рост аномалий при доступе к GitHub из РФ. Жалобы стандартные: отваливается скачивание релизов, лежат технические домены, висят git clone и git pull. Официально РКН заявляет, что ресурс не ограничивается. И технически они, скорее всего, не врут. На практике мы наблюдаем классические последствия ковровых бомбардировок: в попытках заблочить очередные подсети или CDN (тот же Fastly), просто рикошетом цепляют инфраструктуру платформы...
5 дней назад
AI, который работает на молитвах
⛪️ Если вы пробовали собирать AI-агентов через AgentExecutor в LangChain, то знаете, чем это может закончиться. Вы даете LLM 15 тулзов, пишете гигантский системный промпт и надеетесь, что она ничего не перепутает. И на простых задачах это работает. Но как только делаем что-то сложное — моделька вызывает инструменты не в том порядке, забывает контекст или просто уходит в бесконечный цикл галлюцинаций...
5 дней назад
79 символов: архаизм или инженерный дзен
79 символов: архаизм или инженерный дзен? Каждый, кто хоть раз видел, как линтер (или коллега с синдромом вахтёра) подсвечивает красным 80-й символ, задавался вопросом: мы до сих пор живём в 1970-х? Спойлер: отчасти да. 👻 Призраки прошлого Перфокарты IBM на 80 колонок — это "легаси" в самом чистом виде. Мы давно не пробиваем дырки в картоне, но наши инструменты до сих пор живут в рамках этих ограничений. Это тот случай, когда форма определила содержание на десятилетия вперёд. 🛠 Почему это всё ещё актуально: 1...
1 неделю назад
Реальность наносит ответный удар: почему хваленый ИИ набирает 0% в новом бенчмарке
🔨 Вот только что я эссе Джека Кларка о скорой сингулярности и порванном в клочья SWE-Bench, где фигурировали красивые цифры: топовые ИИ выбивают 93.9% на SWE-Bench, почти автономно закрывая реальные issue с GitHub. Казалось бы, пора удалять IDE и идти учиться на баристу. Но вот ребята из Стэнфорда и Гарварда выкатили новый бенчмарк — ProgramBench. И он публично унизил все существующие frontier-модели. Спойлер: результат GPT-5.4, Claude Opus 4.7 и Gemini 3.1 Pro — ровно 0%. В чем суть? Агенту...
1 неделю назад