Исследователи из METR придумали простую, но мощную метрику — "временной горизонт" ИИ-модели. Это длительность задачи (в пересчёте на время эксперта-человека), которую ИИ-агент способен решить с вероятностью 50%. Проще говоря: если задача занимает у опытного разработчика 2 часа, и модель справляется с ней в половине случаев — её временной горизонт равен 2 часам. И вот что показывает график: этот горизонт растёт экспоненциально. В 2019 году модели справлялись с задачами на пару минут. Сейчас свежие модели вроде Claude Opus 4.6 и GPT-5.3 уже решают задачи, на которые у человека уходят часы. Что важно понимать: Это не значит, что ИИ заменит всех программистов завтра. Задачи в тесте — это "чистые" задачи: чётко сформулированные, изолированные, с автоматической проверкой. Реальная работа устроена сложнее — нужен контекст проекта, общение с людьми, понимание бизнес-логики. Но тренд говорит о другом. Год назад агент мог починить мелкий баг. Сегодня — собрать работающий прототип. А через г
Сколько часов работы разработчика может заменить ИИ-агент? METR посчитали
23 февраля23 фев
1 мин