Добавить в корзинуПозвонить
Найти в Дзене
IT Vibe

​​90% правды — это все еще проблема

Тесты показали, что AI Overviews в Google Search ошибается примерно в каждом десятом ответе. На первый взгляд это выглядит как неплохой результат. Но если учитывать масштаб Google, картина меняется. Речь идет о миллионах потенциально неверных ответов, которые распространяются каждую минуту. Исследование проводилось The New York Times совместно с Oumi. Они использовали инструменты ИИ и методику SimpleQA для оценки точности ответов. Еще в прошлом году, когда использовалась модель Gemini 2.5, точность составляла около 85%. После перехода на Gemini 3 она выросла до 91%. Формально прогресс есть. Но ключевая проблема никуда не делась. Даже при высокой точности система продолжает генерировать ошибки. Причем особенно неприятный момент в том, что AI Overviews показывает ссылки на источники, но в случае ошибки сам ответ может противоречить этим источникам. Это создает опасную иллюзию достоверности. Пользователь видит ссылку, доверяет ответу и не перепроверяет его. В итоге ошибка становится не

​​90% правды — это все еще проблема

Тесты показали, что AI Overviews в Google Search ошибается примерно в каждом десятом ответе. На первый взгляд это выглядит как неплохой результат. Но если учитывать масштаб Google, картина меняется. Речь идет о миллионах потенциально неверных ответов, которые распространяются каждую минуту.

Исследование проводилось The New York Times совместно с Oumi. Они использовали инструменты ИИ и методику SimpleQA для оценки точности ответов. Еще в прошлом году, когда использовалась модель Gemini 2.5, точность составляла около 85%. После перехода на Gemini 3 она выросла до 91%.

Формально прогресс есть. Но ключевая проблема никуда не делась. Даже при высокой точности система продолжает генерировать ошибки. Причем особенно неприятный момент в том, что AI Overviews показывает ссылки на источники, но в случае ошибки сам ответ может противоречить этим источникам.

Это создает опасную иллюзию достоверности. Пользователь видит ссылку, доверяет ответу и не перепроверяет его. В итоге ошибка становится не просто ошибкой, а масштабируемым искаженным знанием.

Точность в 90% уже недостаточна, потому что масштаб распространения информации делает оставшиеся 10% критически значимыми.

#AI #Google #Tech

🔳 IT Vibe News