Добавить в корзинуПозвонить
Найти в Дзене

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах 🏥🤖. В проекте участвовали 262 врача из 60 стран. HealthBench оценивает ответы ИИ по пяти критериям: качество общения, следование инструкции, точность, понимание контекста и полнота 🌐. Модели GPT-4.1 и o3 обогнали даже врачей на тестах! Новый маленький GPT-4.1 nano — в 25 раз дешевле и эффективнее прошлой версии 💡. Доступны доп. наборы и подробная документация для всех желающих. #OpenAI #ИИ_в_медицине Подробнее

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах 🏥🤖. В проекте участвовали 262 врача из 60 стран. HealthBench оценивает ответы ИИ по пяти критериям: качество общения, следование инструкции, точность, понимание контекста и полнота 🌐. Модели GPT-4.1 и o3 обогнали даже врачей на тестах! Новый маленький GPT-4.1 nano — в 25 раз дешевле и эффективнее прошлой версии 💡. Доступны доп. наборы и подробная документация для всех желающих.

#OpenAI #ИИ_в_медицине

Подробнее