15 подписчиков

В сентябре обсуждали, что

23 декабря 202523 дек 2025

~1 мин

ИИ не может заменить человека на работе — но это только пока OpenAI представили новый бенчмарк GDPval — его цель понять, насколько ИИ близки к тому, чтобы превзойти людей в экономически ценной работе. Там была такая статистика: 🟢 Всего оценивали 1320 задач из 44 профессий и 9 сфер: от юристов и инженеров до медсестер. Ответы ИИ слепо сравнивали с решениями экспертов из сферы. 🟢 В результате Claude Opus 4.1 оказался лучше или на уровне людей в 49% случаев, GPT-5-high в 40%. Чтобы понимать, насколько быстро идет прогресс — GPT-4o справляется хорошо лишь с 12% задач. 🟢 Модели особенно сильны в задачах с чёткой структурой — кодинг, анализ данных. Хуже всего справляются с работой бухгалтеров, аудиторов, медиков и консьержей. Ну и выводы: …профессии, где больше 60% задач делают руками не оценивались… пока под ударом именно «интеллектуальные профессии»…. кто я? | закрытый чат | курс про ИИ

ИИ не может заменить человека на работе — но это только пока

OpenAI представили новый бенчмарк GDPval — его цель понять, насколько ИИ близки к тому, чтобы превзойти людей в экономически ценной работе.

Там была такая статистика:

🟢 Всего оценивали 1320 задач из 44 профессий и 9 сфер: от юристов и инженеров до медсестер. Ответы ИИ слепо сравнивали с решениями экспертов из сферы.

🟢 В результате Claude Opus 4.1 оказался лучше или на уровне людей в 49% случаев, GPT-5-high в 40%. Чтобы понимать, насколько быстро идет прогресс — GPT-4o справляется хорошо лишь с 12% задач.

🟢 Модели особенно сильны в задачах с чёткой структурой — кодинг, анализ данных. Хуже всего справляются с работой бухгалтеров, аудиторов, медиков и консьержей.

Ну и выводы:

…профессии, где больше 60% задач делают руками не оценивались… пока под ударом именно «интеллектуальные профессии»….

кто я? | закрытый чат | курс про ИИ