Найти в Дзене

Сколько часов работы разработчика может заменить ИИ-агент? METR посчитали

Исследователи из METR придумали простую, но мощную метрику — "временной горизонт" ИИ-модели. Это длительность задачи (в пересчёте на время эксперта-человека), которую ИИ-агент способен решить с вероятностью 50%. Проще говоря: если задача занимает у опытного разработчика 2 часа, и модель справляется с ней в половине случаев — её временной горизонт равен 2 часам. И вот что показывает график: этот горизонт растёт экспоненциально. В 2019 году модели справлялись с задачами на пару минут. Сейчас свежие модели вроде Claude Opus 4.6 и GPT-5.3 уже решают задачи, на которые у человека уходят часы. Что важно понимать: Это не значит, что ИИ заменит всех программистов завтра. Задачи в тесте — это "чистые" задачи: чётко сформулированные, изолированные, с автоматической проверкой. Реальная работа устроена сложнее — нужен контекст проекта, общение с людьми, понимание бизнес-логики. Но тренд говорит о другом. Год назад агент мог починить мелкий баг. Сегодня — собрать работающий прототип. А через г

Сколько часов работы разработчика может заменить ИИ-агент? METR посчитали.

Исследователи из METR придумали простую, но мощную метрику — "временной горизонт" ИИ-модели. Это длительность задачи (в пересчёте на время эксперта-человека), которую ИИ-агент способен решить с вероятностью 50%.

Проще говоря: если задача занимает у опытного разработчика 2 часа, и модель справляется с ней в половине случаев — её временной горизонт равен 2 часам.

И вот что показывает график: этот горизонт растёт экспоненциально. В 2019 году модели справлялись с задачами на пару минут. Сейчас свежие модели вроде Claude Opus 4.6 и GPT-5.3 уже решают задачи, на которые у человека уходят часы.

Что важно понимать:

Это не значит, что ИИ заменит всех программистов завтра. Задачи в тесте — это "чистые" задачи: чётко сформулированные, изолированные, с автоматической проверкой. Реальная работа устроена сложнее — нужен контекст проекта, общение с людьми, понимание бизнес-логики.

Но тренд говорит о другом. Год назад агент мог починить мелкий баг. Сегодня — собрать работающий прототип. А через год? Вопрос не "заменит ли ИИ разработчиков", а "какие задачи останутся только за людьми".

Для тех, кто строит продукты, вывод такой: если ты до сих пор не используешь ИИ-агентов в разработке — ты уже отстаёшь. Не от конкурентов с большой командой, а от одиночки с правильными инструментами.

🔗 Полное исследование: metr.org/time-horizons

🤖 В эпоху AI