В анонсе GPT-5.2 разработчики сообщили о значительном снижении количества галлюцинаций в новой модели. Тестирование проводилось на запросах, имитирующих реальные диалоги в ChatGPT, а ответы оценивались отдельной моделью с доступом к интернету. Оценивались два показателя: доля неверных фактов во всех утверждениях ответа и доля ответов, содержащих хотя бы одну серьезную фактическую ошибку. Результаты показали, что GPT-5.2 Thinking с включенным поиском выдает всего 0,8% ошибочных утверждений, по сравнению с 1,5% у GPT-5.1 Thinking. Это почти двукратное снижение. Доля ответов с крупными ошибками также уменьшилась – с 8,8% до 5,8% (на треть). Во всех пяти тематических категориях, включая новости и текущие события, модель демонстрирует точность ниже 1%. Без использования поиска ситуация меняется: GPT-5.2 Thinking показывает 3,1% ошибочных утверждений и 10,9% ответов с серьезными ошибками. Улучшение по сравнению с GPT-5.1 есть, но оно незначительно – около 14%. Также улучшился показатель "kno
GPT-5.2: Резкое снижение галлюцинаций и обновление знаний
12 декабря 202512 дек 2025
1 мин