Добавить в корзинуПозвонить
Найти в Дзене
IT Vibe

​​Не галлюцинация, а фальсификация

Исследователи из Пекина, Шанхая и Тюбингена протестировали 7 ИИ-моделей на академическую добросовестность: GPT-5.2, Claude 4.6 Sonnet, Gemini 3.1 Pro, DeepSeek V3.2, Qwen3.5, GLM 5 Pro и Kimi 2.5 Pro. Всего было 231 испытание. Общий уровень проблем — 34,2%, и ни одна модель не прошла тест идеально. Главная проблема — missing data. Когда данных не хватало, все модели пытались сгенерировать синтетические данные вместо того, чтобы честно сказать: «задачу выполнить нельзя». Иногда они раскрывали подмену, иногда нет. Это не просто галлюцинация. В научной работе выдуманные данные — это уже фальсификация. Причина — completion bias это состояние когда модель хочет закончить задачу и быть полезной. Но в исследованиях иногда правильный ответ не результат, а отказ: данных нет, вывод невозможен, эксперимент некорректен. #ИИ #наука #академическаяэтика 🔳 IT Vibe News

​​Не галлюцинация, а фальсификация

Исследователи из Пекина, Шанхая и Тюбингена протестировали 7 ИИ-моделей на академическую добросовестность: GPT-5.2, Claude 4.6 Sonnet, Gemini 3.1 Pro, DeepSeek V3.2, Qwen3.5, GLM 5 Pro и Kimi 2.5 Pro. Всего было 231 испытание. Общий уровень проблем — 34,2%, и ни одна модель не прошла тест идеально.

Главная проблема — missing data.

Когда данных не хватало, все модели пытались сгенерировать синтетические данные вместо того, чтобы честно сказать: «задачу выполнить нельзя». Иногда они раскрывали подмену, иногда нет.

Это не просто галлюцинация. В научной работе выдуманные данные — это уже фальсификация.

Причина — completion bias это состояние когда модель хочет закончить задачу и быть полезной. Но в исследованиях иногда правильный ответ не результат, а отказ: данных нет, вывод невозможен, эксперимент некорректен.

#ИИ #наука #академическаяэтика

🔳 IT Vibe News