Добавить в корзину Позвонить

Gimal-AI - новости и тренды ИИ

22 подписчика

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах

14 мая 202514 мая 2025

~1 мин

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах 🏥🤖. В проекте участвовали 262 врача из 60 стран. HealthBench оценивает ответы ИИ по пяти критериям: качество общения, следование инструкции, точность, понимание контекста и полнота 🌐. Модели GPT-4.1 и o3 обогнали даже врачей на тестах! Новый маленький GPT-4.1 nano — в 25 раз дешевле и эффективнее прошлой версии 💡. Доступны доп. наборы и подробная документация для всех желающих. #OpenAI #ИИ_в_медицине Подробнее

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах 🏥🤖. В проекте участвовали 262 врача из 60 стран. HealthBench оценивает ответы ИИ по пяти критериям: качество общения, следование инструкции, точность, понимание контекста и полнота 🌐. Модели GPT-4.1 и o3 обогнали даже врачей на тестах! Новый маленький GPT-4.1 nano — в 25 раз дешевле и эффективнее прошлой версии 💡. Доступны доп. наборы и подробная документация для всех желающих. #OpenAI #ИИ_в_медицине Подробнее

...Читать далее

OpenAI представила HealthBench — новый бенчмарк для проверки ИИ-моделей в медицинских диалогах 🏥🤖. В проекте участвовали 262 врача из 60 стран. HealthBench оценивает ответы ИИ по пяти критериям: качество общения, следование инструкции, точность, понимание контекста и полнота 🌐. Модели GPT-4.1 и o3 обогнали даже врачей на тестах! Новый маленький GPT-4.1 nano — в 25 раз дешевле и эффективнее прошлой версии 💡. Доступны доп. наборы и подробная документация для всех желающих.

#OpenAI #ИИ_в_медицине

Подробнее