Найти в Дзене
Любовь Черемисина

OpenAI представила GDPval — новый стандарт для оценки ИИ на реальных прибыльных задачах, которые встречаются в бизнесе из 44 профессий

OpenAI представила GDPval — новый стандарт для оценки ИИ на реальных прибыльных задачах, которые встречаются в бизнесе из 44 профессий. Суть: современные ИИ-модели уже могут выполнять значимую часть реальных профессиональных задач гораздо быстрее и дешевле, чем эксперты — и не только отвечать на вопросы, а реально делать “боевую” работу предпринимателей и топ-специалистов. Это шанс радикально увеличить эффективность команды и снизить издержки. Раньше искусственный интеллект в основном тестировали на сложных научных задачах или экзаменационных вопросах: модели соревновались в решении академических тестов, аналитических и математических задач, написании кода или прохождении языковых экзаменов. Это была “лабораторная” проверка, далекая от реальной бизнес-практики. GDPval — совершенно иной подход. Здесь ИИ тестируют на прикладных, экономически востребованных задачах: реальные кейсы бизнеса, документы, переговоры, планы, юридические записки, клиентские обращения, рабочие инструкции — то

OpenAI представила GDPval — новый стандарт для оценки ИИ на реальных прибыльных задачах, которые встречаются в бизнесе из 44 профессий.

Суть: современные ИИ-модели уже могут выполнять значимую часть реальных профессиональных задач гораздо быстрее и дешевле, чем эксперты — и не только отвечать на вопросы, а реально делать “боевую” работу предпринимателей и топ-специалистов. Это шанс радикально увеличить эффективность команды и снизить издержки.

Раньше искусственный интеллект в основном тестировали на сложных научных задачах или экзаменационных вопросах: модели соревновались в решении академических тестов, аналитических и математических задач, написании кода или прохождении языковых экзаменов.

Это была “лабораторная” проверка, далекая от реальной бизнес-практики.

GDPval — совершенно иной подход. Здесь ИИ тестируют на прикладных, экономически востребованных задачах: реальные кейсы бизнеса, документы, переговоры, планы, юридические записки, клиентские обращения, рабочие инструкции — то, с чем сталкивается каждый предприниматель и его команда в реальной жизни.

Вот примеры рабочих задач, которые тестировали:

➡️ Юристы

Задачи: анализ юридических документов, написание юридических заключений, составление контрактов, подготовка обзоров законодательства и проведение юридической экспертизы.

➡️ Медицинские работники (например, медсестры, медицинские администраторы)

Задачи: составление планов ухода за пациентом, коммуникация с коллегами и пациентами, оформление медицинской документации, решение нестандартных клинических кейсов.

➡️ Проектные менеджеры и менеджеры по продукту

Задачи: подготовка презентаций, создание проектной документации, анализ требований, работа с рабочими группами и stakeholder-отчетность.

➡️ Финансовые аналитики и консультанты

Задачи: подготовка инвестиционного отчета, анализ финансовых данных компании, составление рекомендаций для клиента, моделирование бизнес-сценариев.

➡️ Программисты

Задачи: поиск и исправление багов в коде, анализ технических требований, дизайн архитектуры ПО, подготовка и ревью проектной документации, консультирование коллег.

Все задачи были максимально приближены к реальным задачам: документы, схемы, переписка, презентации, техотчеты, планы и записки, а не просто ответы на теоретические вопросы.

GDPval — это шаг к тому, чтобы сравняться с реальным рынком, а не теорией. Уже сейчас ИИ в состоянии помогать маркетологам и предпринимателям делать серьёзные задачи быстрее. Но главный выигрыш — не в замене, а в коллаборации: использовать “машинный труд” там, где он эффективен, и направлять его силой человеческого мышления.

💬 Бот с курсами по маркетингу

💬 Канал Reffocus

💬 AI дня. Новости и тренды

💬 Сайт автора

#Маркетинг #ИскусственныйИнтеллект #OpenAI