17 подписчиков

Все спорят: AI-агенты — это революция, которая заменит людей, или хайп

12 мая12 мая

1 мин

? И те, и другие не правы. 1️⃣ Первые обещают, что завтра программы будут делать вообще всё. 2️⃣ Вторые тычут пальцем: «они галлюцинируют», «они ускоряют программирование всего на 10-15%», «на больших проектах AI рассыпается». Это ложные заключения. Про 10-15% — правда двухлетней давности. Microsoft Research изучал GitHub Copilot в 2023 году и показал именно такие цифры. Но с тех пор модели шагнули далеко вперёд. Современные агенты (GPT-5.5, Claude Opus 4.7, DeepSeek V4) решают инженерные задачи уровня мидл-разработчика. На SWE-bench — честном тесте для программистов — нейросети набирают 64-80%. Это не ускорение на 15%. Это замена нескольких часов работы. Про галлюцинации — то же самое. В 2023 году LLM придумывали факты. Сегодня агенты умеют проверять себя: ищут в интернете, сверяются с документацией, запускают код и смотрят на ошибки. Они не галлюцинируют — они ошибаются и исправляются. Как человек. Что работает прямо сейчас: 🤖 AI-агент получает задачу «напиши API для магазина»

Все спорят: AI-агенты — это революция, которая заменит людей, или хайп?

И те, и другие не правы.

1️⃣ Первые обещают, что завтра программы будут делать вообще всё.

2️⃣ Вторые тычут пальцем: «они галлюцинируют», «они ускоряют программирование всего на 10-15%», «на больших проектах AI рассыпается».

Это ложные заключения.

Про 10-15% — правда двухлетней давности.

Microsoft Research изучал GitHub Copilot в 2023 году и показал именно такие цифры. Но с тех пор модели шагнули далеко вперёд. Современные агенты (GPT-5.5, Claude Opus 4.7, DeepSeek V4) решают инженерные задачи уровня мидл-разработчика. На SWE-bench — честном тесте для программистов — нейросети набирают 64-80%. Это не ускорение на 15%. Это замена нескольких часов работы.

Про галлюцинации — то же самое.

В 2023 году LLM придумывали факты. Сегодня агенты умеют проверять себя: ищут в интернете, сверяются с документацией, запускают код и смотрят на ошибки. Они не галлюцинируют — они ошибаются и исправляются. Как человек.

Что работает прямо сейчас:

🤖 AI-агент получает задачу «напиши API для магазина», пишет код, тестирует, находит баги и чинит. Без человека.

🤖 AI-агент разбирает 500 писем за минуту и сортирует: спам, клиент, срочно. 80% рутины исчезает.

🤖 AI-агент собирает информацию из десятков источников в один документ. День работы за минуту.

Это не замена человеку 👨‍🔧

Это калькулятор для математика: думать всё ещё нужно головой. Но скучные вычисления больше не ваша забота.

Главная ошибка — повторять мифы двухлетней давности, пока технологии убежали далеко вперёд. AI-агенты умеют практически всё. Вопрос в том, умеем ли мы ставить им правильные задачи.

А вы бы доверили рутину программе?