Модели приближаются к возможности выполнять сложные задачи без участия человека. Современные системы искусственного интеллекта пока уступают людям в выполнении длительных задач, но их развитие идет настолько стремительно, что этот разрыв может исчезнуть раньше, чем ожидалось. К такому выводу пришли исследователи из некоммерческой организации METR, базирующейся в Беркли, Калифорния. Команда METR разработала почти 170 реальных задач в таких областях, как программирование, кибербезопасность, логическое мышление и машинное обучение. Для оценки прогресса ИИ специалисты установили «человеческий базовый уровень», измеряя, сколько времени требуется экспертам для их выполнения. Затем они предложили новую метрику — «горизонт завершения задач». Этот показатель отражает, сколько времени в среднем требуется программистам для решения задач, с которыми модели ИИ справляются с определенной долей успеха. В опубликованной на arXiv работе исследователи проанализировали 13 передовых моделей ИИ и обнаружил
Секундная стрелка эволюции: ИИ сокращает разрыв с человеком вдвое каждый квартал
21 марта 202521 мар 2025
25
3 мин