Добавить в корзинуПозвонить
Найти в Дзене

Это неприятный класс ошибок: модель отвечает правильно, но показывает не тот кусок документа, будто уверенно указывает пальцем не туда

Для обычного чата это просто странно, а для юристов, врачей и финансовых аналитиков — уже риск аудита. CiteVQA хорошо подсвечивает проблему: нам нужны не только умные ответы, но и проверяемая цепочка доказательств. Внутри коротко разобрал, почему «ответ со ссылкой» больше нельзя считать автоматическим доказательством. CiteVQA показал, что AI путает источники правильных ответов

Это неприятный класс ошибок: модель отвечает правильно, но показывает не тот кусок документа, будто уверенно указывает пальцем не туда. Для обычного чата это просто странно, а для юристов, врачей и финансовых аналитиков — уже риск аудита. CiteVQA хорошо подсвечивает проблему: нам нужны не только умные ответы, но и проверяемая цепочка доказательств. Внутри коротко разобрал, почему «ответ со ссылкой» больше нельзя считать автоматическим доказательством.

CiteVQA показал, что AI путает источники правильных ответов