Найти в Дзене

Gemini 3 Pro и GPT-5 не справляются с задачами по физике

Gemini 3 Pro и GPT-5 не справляются с задачами по физике Создан новый бенчмарк по физике CritPt, который проверяет ведущие ИИ на уровне начального этапа аспирантуры. Тест показал: даже такие системы, как Gemini 3 Pro и GPT-5, сильно уступают реально самостоятельным учёным. Более 50 физиков из 30 учреждений разработали CritPt, чтобы понять, может ли ИИ реально помогать в исследованиях по современной физике. Здесь не просто проверяется знание… Подробнее

Gemini 3 Pro и GPT-5 не справляются с задачами по физике

Создан новый бенчмарк по физике CritPt, который проверяет ведущие ИИ на уровне начального этапа аспирантуры. Тест показал: даже такие системы, как Gemini 3 Pro и GPT-5, сильно уступают реально самостоятельным учёным.

Более 50 физиков из 30 учреждений разработали CritPt, чтобы понять, может ли ИИ реально помогать в исследованиях по современной физике. Здесь не просто проверяется знание…

Подробнее