🔥 Закон Мура Anthropic для ИИ Команда из Anthropic выпустила великолепный документ с анализом динамики развития ИИ моделей и предложила простой и понятный критерий количественной оценки систем ИИ в терминах человеческих возможностей. ❗️ Встречаем новую метрику: 50% временной горизонт выполнения задач. Это время, которое обычно требуется людям для выполнения задач, которые модели ИИ могут автономно выполнить с 50%-ной вероятностью успеха. Исследователи провели эксперименты с участием людей-экспертов и 13 передовых моделей ИИ (2019-2025 гг.) на наборе из 170 разнообразных задач (RE-Bench, HCAST и новый набор SWAA). Было измерено время выполнения задач людьми и уровень успеха ИИ. Ключевые выводы: 1️⃣ Способность ИИ выполнять сложные задачи удваивается каждые 7 месяцев с 2019 года. Современные модели (Claude 3.7 Sonnet) имеют "50%-ный временной горизонт" около 50 минут — они могут с 50% вероятностью успешно выполнять задачи, занимающие у квалифицированного человека 50 минут. 2️⃣ К концу 2