Дмитрий Ильин | AI-разработчик

Твой AI-агент может выполнить приказ незнакомца через отчет в Sentry — атака срабатывает в 85% случаев. В погоне за «бесшовной интеграцией» через MCP мы создали конвейер доставки вредоноса прямо в терминал. Нам продают MCP как объединение всех данных в одном окне. Теперь твой Claude Code или Cursor может сам сходить в Sentry, забрать логи и предложить исправление. На деле это системный провал архитектуры доверия. Проблема в том, что MCP создает слепой конвейер. Агент не делает различий между «инертными» данными (просто текстом ошибки) и «активными» инструкциями...

8 часов назад

GPT-5.6 Sol: доступ по пропускам США и 91.9% в кодинге

OpenAI выкатила GPT-5.6 Sol, и теперь за кодом нужно стоять в очереди в министерство США. Модель выбила 91.9% в кодинге, но доступ к ней выдают по одобрению правительства. Похоже, эра открытого ИИ сменяется эпохой цифровых пропусков и стратегических пайков, где интеллект распределяют как дефицитное продовольствие. Представь, что ты привык покупать софт по подписке за двадцать баксов, а в один прекрасный день тебе говорят: «Модель крутая, но сначала сходи в местное министерство и получи разрешение на использование»...

23 часа назад

ChatGPT Dreaming: ИИ создаёт твоё досье с точностью 82.8%

Пока ты спишь, ChatGPT «видит сны» о тебе, перерабатывая историю переписок в структурированное досье с точностью 82.8%. Забудь про разрозненные заметки — теперь это полноценный синтез твоей личности в фоновом режиме. Звучит как мечта об идеальном помощнике, но на деле мы получаем систему, которая может тихо переписать твои предпочтения, пока ты не заметишь. OpenAI выкатила Dreaming V3 — архитектуру, которая превращает твой чат в бесконечный сеанс психоанализа. Раньше всё было проще: ты говорил «запомни, что я не люблю курсив», и нейронка ставила галочку в статичном списке...

1 день назад

OpenRouter Fusion: как 3 дешёвых модели заменяют одну Fable 5

Система Fusion выжимает из бюджетных нейронок 64.7% точности в сложных задачах, почти догнав элитную Fable 5. Это значит, что правильная организация процесса сейчас важнее, чем размер модели. Раньше мы гнались за параметрами, теперь — за архитектурой взаимодействия. Хватит играть в лотерею промптов, отправляя один и тот же запрос в три разных чата, чтобы понять, кто из них сегодня меньше галлюцинирует. Теперь можно заставить нейронки спорить между собой, пока третья — самая умная — не выберет лучший вариант...

2 дня назад

Apple AgentKit: локальный агент за 1.2 сек против мощи облака

Теперь твой AI-агент живёт прямо в айфоне с задержкой всего 1.2 секунды на шаг. Разбор почты и календаря теперь доверен тому, кто физически не может сдать данные третьим лицам. Представь, что у тебя появился личный секретарь, который знает о твоих делах всё, но при этом заперт в комнате без интернета и под жесточайшим NDA. Именно так работает AgentKit. Apple решила бить в самое больное место современных нейронок — облачную тревожность. Пока OpenAI и Google пытаются затащить всю твою жизнь на свои серверы, Apple просто оставила всё внутри устройства...

3 дня назад

Arbor Framework: в 2.5 раза эффективнее Claude Code в кодинге

Большинство AI-кодеров работают как упрямые отличники: пробуют одно решение, и если оно не взлетает, мучительно перебирают варианты по одному. Arbor Framework решает эту проблему, запуская целую армию клонов-агентов в разных ветках гита одновременно. Результат — эффективность в 2.5 раза выше, чем у Claude Code на тех же мощностях. Представь, что ты нанял крутого программиста. Он умный, знает все библиотеки, но работает линейно: пробует одно решение, если оно не взлетает — пробует другое. Проблема в том, что в сложных задачах такие агенты часто зацикливаются...

4 дня назад

Сканер Midjourney: 358 000 датчиков вместо генерации картинок

Midjourney выпустила сканер тела с 358 000 датчиков, который обещает создать 3D-карту органов за 60 секунд. Пока мы подбирали промпты для котиков, компания решила зайти в медицину. Это похоже на то, как если бы гигант соцсетей начал продавать рентген-аппараты, потому что «мы всё равно умеем в картинки». До этого момента Midjourney была мастером цифрового обмана. Ты пишешь [киберпанк-город в стиле барокко], и нейронка собирает тебе красивый, но абсолютно выдуманный мир из миллиардов пикселей. Теперь...

5 дней назад

Copilot vs Cursor: лимит 40 инструментов против ARD

GitHub выкатил Agent Finder: теперь ИИ-помощник сам ищет инструменты по вебу и навсегда убивает ручную правку JSON-конфигов. Твой агент превращается из чат-бота в автономного менеджера. Если ты хоть раз пытался развернуть MCP-сервер в Cursor или Claude Desktop, ты знаешь этот ритуал. Сначала ищешь URL сервера, потом аккуратно вписываешь его в mcp.json, молишься, чтобы не пропустить запятую, и перезагружаешь клиент. Это похоже на настройку старого модема в девяностых, когда один неверный символ в консоли превращал всё в тыкву...

6 дней назад

Cursor за 60 млрд: почему Маск купил падающий актив?

Илон Маск отдал 60 млрд $ за Cursor, который теряет рынок. Пока Anthropic забирает программистов, Илон пытается спасти Grok от позора в кодинге. Представь, что ты покупаешь старый гараж по цене пентхауса в центре Нью-Йорка. Примерно так выглядит сделка SpaceX по выкупу Cursor. 60 миллиардов долларов акциями за форк VS Code — это либо величайший расчёт в истории софта, либо очередной приступ оптимизма Маска перед IPO его ракетной компании. Цифры говорят о том, что Cursor сейчас напоминает падающий нож...

1 неделю назад

84% кодеров Uber перешли на Claude Code — и обнулили бюджет

84% инженеров Uber перешли на Claude Code, и компания сжгла годовой бюджет на ИИ всего за четыре месяца. Продуктивность выросла в разы, но теперь финансовый директор пытается понять, почему автономный агент обходится компании дороже, чем целый отдел джунов. Если ты привык к Copilot или Cursor, Claude Code стал совсем другим зверем. Забудь про удобную подсветку в IDE — перед тобой полноценный агент в терминале. Он сам читает весь твой репозиторий, планирует правки в десятках файлов, запускает тесты и сам делает коммиты в Git...

1 неделю назад

AI-червь из Торонто взломал 74% сети: патчи больше не спасают

В Университете Торонто создали AI-червя: за неделю он взломал почти 74% тестовой сети, изучая отчеты об уязвимостях в реальном времени. Этот вирус за секунду до взлома проходит ускоренный курс слесаря именно по твоей модели замка. Вспомни WannaCry из 2017-го. Это был классический цифровой таран: один мощный эксплойт, который бил в одну и ту же дыру. Как только вышла заплатка, червь стал бесполезным куском кода. Всё работало линейно и предсказуемо. С новым AI-червем эта схема летит в мусорку. Здесь...

1 неделю назад

Microsoft MAI: в 10 раз дешевле GPT, но слабее Claude 4.8

Microsoft заменила OpenAI в Copilot своими моделями MAI, сэкономив в 10 раз. Но эта «независимость» обернулась заметной потерей качества. Звучит как триумф, пока не копнёшь в цифры. Представь, что ты годами снимал дорогущий пентхаус у соседа, переплачивая за каждый квадратный метр. А потом внезапно решил построить свой собственный небоскрёб прямо напротив. Теперь можно переставлять стены как хочешь, не спрашивать разрешения и, главное, перестать платить аренду. Именно это сейчас сделала Microsoft с бэкендом Copilot и VS Code...

1 неделю назад