OpenAI представила GDPval — новый стандарт для оценки ИИ на реальных прибыльных задачах, которые встречаются в бизнесе из 44 профессий. Суть: современные ИИ-модели уже могут выполнять значимую часть реальных профессиональных задач гораздо быстрее и дешевле, чем эксперты — и не только отвечать на вопросы, а реально делать “боевую” работу предпринимателей и топ-специалистов. Это шанс радикально увеличить эффективность команды и снизить издержки. Раньше искусственный интеллект в основном тестировали на сложных научных задачах или экзаменационных вопросах: модели соревновались в решении академических тестов, аналитических и математических задач, написании кода или прохождении языковых экзаменов. Это была “лабораторная” проверка, далекая от реальной бизнес-практики. GDPval — совершенно иной подход. Здесь ИИ тестируют на прикладных, экономически востребованных задачах: реальные кейсы бизнеса, документы, переговоры, планы, юридические записки, клиентские обращения, рабочие инструкции — то
OpenAI представила GDPval — новый стандарт для оценки ИИ на реальных прибыльных задачах, которые встречаются в бизнесе из 44 профессий
26 сентября 202526 сен 2025
2 мин