72,6 тыс подписчиков

Галлюцинации ИИ: разбираемся, когда стоит сомневаться в ответах и как их проверить

26 июня26 июн

7 мин

Современные языковые модели активно используются в работе, но полностью доверять им нельзя. Время от времени они привирают. Специалисты называют такие сбои галлюцинациями. Вместе с МТС Линк Медиа разбираемся, в каких ситуациях стоит подвергать ИИ-ответы сомнению и как строить диалог с алгоритмом, чтобы он реже придумывал небылицы. Причина кроется в устройстве больших языковых моделей. Они не работают как базы данных, где к каждому факту можно обратиться напрямую. Вместо этого сети выучивают статистические взаимосвязи между словами на основе огромных массивов текстовой информации. Когда речь идёт о распространённых, многократно описанных событиях, это даёт приемлемый результат. Но как только запрос касается редких или совсем свежих тем, начинаются проблемы — в исходных данных для обучения таких примеров мало, и они часто противоречат друг другу. Главная задача нейросети — сформулировать связный, логичный и убедительный текст. При этом у неё нет точного внутреннего механизма, который отд

Оглавление

Почему алгоритмы начинают выдумывать
С какими видами ложной информации сталкиваются пользователи
Фальшивые источники

Почему алгоритмы начинают выдумывать

Причина кроется в устройстве больших языковых моделей. Они не работают как базы данных, где к каждому факту можно обратиться напрямую. Вместо этого сети выучивают статистические взаимосвязи между словами на основе огромных массивов текстовой информации. Когда речь идёт о распространённых, многократно описанных событиях, это даёт приемлемый результат. Но как только запрос касается редких или совсем свежих тем, начинаются проблемы — в исходных данных для обучения таких примеров мало, и они часто противоречат друг другу.

Главная задача нейросети — сформулировать связный, логичный и убедительный текст. При этом у неё нет точного внутреннего механизма, который отделяет точные сведения от приблизительных. Если нужной информации не хватает, модель её нередко просто придумывает, чтобы восполнить пробелы. Более того, иногда ИИ не может ответить «я не знаю», так внутренние установки побуждают его, в первую очередь, быть полезным.

Вот характерный случай. Однажды перед системой поставили задачу написать статью для турфирмы о том, какие турецкие пляжи обычно остаются за пределами внимания туристов. Нужно было перечислить семь таких мест. В итоге два из семи описаний оказались полностью сфальсифицированными — таких пляжей в реальности не существует. Однако текст выглядел безупречно: были названия, детали, даже отзывы. Просто базе знаний ИИ не хватило реальных локаций, и он досочинил недостающие.

Ещё одна причина — так называемое сжатие информации. При обучении модель сжимает миллиарды примеров в конечное количество параметров. В этом процессе некоторые сведения, особенно редкие или неоднозначные, могут «слипнуться». Например, из-за похожих контекстов цитату одного человека алгоритм ошибочно приписывает другому.

Излечимы ли галлюцинации ИИ в будущем? Сами создатели таких систем признают: полностью исключить такие сбои невозможно. Однако прогресс очевиден. Если в начале 2023 года на фактологические вопросы ChatGPT давал неверный ответ в каждом пятом случае (20%), то сегодня этот показатель упал до 3–5%. Улучшение обеспечено несколькими нововведениями:

модели стали дообучаться на реакции людей, и теперь они могут сигнализировать о своей неуверенности;
алгоритмы научились показывать ход собственных рассуждений;
появилась возможность подключать поиск в интернете для сверки со свежими данными, хотя это и не панацея.

Есть и обратная сторона. Галлюцинации стали менее грубыми, а распознать их сложнее. Скажем, если нейросеть перепутает 1895 год с 1995 годом, это заметит каждый. А вот если она будет ссылаться на несуществующее научное исследование с правдоподобным названием, такой обман можно и не заметить, особенно если пользователь неспециалист.

С какими видами ложной информации сталкиваются пользователи

Чтобы успешно выявлять ошибки, полезно знать, какие типы небылиц чаще всего порождает ИИ.

Фальшивые источники

По запросу модель может выдать ссылки на статьи и отчёты, которые выглядят вполне реально. Но при переходе по ним окажется, что страницы не существует.

Перепутанные даты и показатели

Даже опираясь на достоверные первоисточники, модель способна исказить цифры или временные отметки. Недостаток данных она восполняет собственными домыслами.

Смешение персоналий

Реальный случай из жизни одного человека (например, известное высказывание или достижение) приписывается другому. Особенно часто это происходит, если у экспертов одинаковые фамилии

Неактуальная информация

Нейросеть не ориентируется в текущем времени. Она оперирует данными на момент своего последнего обучения. Запросив актуальные профессиональные тренды на 2026 год, можно получить выдержку из материалов двухлетней давности.

Ложные юридические факты

ИИ может сгенерировать несуществующий закон, судебное решение или нормативный акт. В США уже был прецедент, когда федеральный судья в 2025 году использовал нейросеть для подготовки постановления, а позже выяснилось, что в тексте содержались выдуманные цитаты из законов и ссылки на организации, которые к делу не относились.

Когда и каким способом перепроверять ИИ-ответы

Тотальная проверка каждого сгенерированного текста отнимает массу времени. Но без неё высок риск пропустить критическую ошибку. Оптимальный подход — разделять задачи по степени важности.

Если речь идёт о юридических документах, финансовых отчётах, статистике или медицинских рекомендациях, проверять нужно полностью и тщательно. Другое дело — написание блога, когда нейросеть используется поэтапно: сначала с её помощью готовят план и структуру, затем — черновик. В таком случае модель на каждом шаге получает дополнительный контекст, что снижает вероятность выдумок. Достаточно выборочно сверить цифры, имена, ссылки и названия.

Очень помогает насмотренность. Чем чаще вы правите ИИ-тексты, тем быстрее учитесь замечать потенциально опасные места. Однако отсутствие специальных знаний опытом не заменишь.

Вы можете эффективно работать с ИИ по какой-то теме, только если сами в этой теме разбираетесь.

Алгоритм проверки примерно такой же, как при работе с любой другой информацией от человека. В приоритете — конкретные данные: процентные доли, суммы, даты, гиперссылки на источники, цитаты. А вот признаки, которые должны насторожить:

модель излагает информацию категорично и без оговорок, хотя точного прогноза быть не может (например, отвечая на вопрос об уровне безработицы через год);
в ответе присутствуют детали, которые пользователь не запрашивал;
в рамках одного диалога ИИ начинает противоречить сам себе.

Если конкретный фрагмент ответа вызывает сомнения, можно прибегнуть к одному из следующих приёмов.

Запросите первоисточник

Попросите нейросеть указать, откуда именно взята спорная статистика или цитата — конкретный отчёт, интервью, публикация. Больше того, ещё на этапе написания промпта приучите себя запрашивать у ИИ источники всех значимых фактов: проверить уже имеющиеся ссылки проще, чем эти ссылки искать.

Опросите несколько моделей

Задайте один и тот же вопрос двум-трём разным ИИ. Если ответы различаются, придётся искать информацию вручную. Также можно поручить одной системе проверить ответ другой.

Попросите оценить достоверность

Прямой вопрос вроде «Насколько ты уверен в каждом из этих фактов по стобалльной шкале?» заставляет модель мысленно перепроверить себя и иногда скорректировать выдачу.

Подключите эксперта-человека

Самый надёжный вариант. Если нейросеть готовила аналитику по рынку труда, пусть финальный текст посмотрит опытный HR-специалист или карьерный консультант.

Как договориться с ИИ, чтобы он меньше выдумывал

Правильные формулировки запросов и грамотное управление диалогом заметно сокращают время на последующую проверку.

Первое правило — больше контекста. Чем больше вводных данных вы предоставите модели, тем реже ей придётся что-то придумывать. Современные сервисы позволяют загружать файлы, инструкции, таблицы и ссылки — пользуйтесь этим.

Второе правило — конкретика в задаче. Вместо размытого «расскажи про недвижимость» используйте чёткое: «приведи статистику по жилой недвижимости в Москве за первый квартал 2026 года с разбивкой по административным округам».

Третье правило — шкала уверенности. После получения развёрнутого ответа спросите: «Оцени, насколько каждый из приведённых фактов достоверен по десятибалльной шкале». Это не удалит ложь, но подсветит самые проблемные зоны.

Четвёртое правило — дробите сложные задачи. Поэтапный сбор информации проверять гораздо легче. Например, если нужно конкурентное исследование, сначала попросите ИИ определить методологию такого исследования, затем — выделить конкурентов, потом — собрать данные по каждому.

Важно помнить, что универсального рецепта, полностью исключающего галлюцинации, не существует. Лучших результатов добивается тот, кто использует все перечисленные техники в комплексе и регулярно сверяет выходные данные нейросетей с внешними источниками.

Хотите больше знать о нейросетях? Читайте МТС Линк Медиа! Там вы найдёте разборы реальных кейсов использования ИИ, интервью с практикующими экспертами, подробные гайды по созданию промптов и полезные лайфхаки.

Переходите по ссылке, чтобы читать сейчас

Подписывайтесь на наш канал. Рассказываем о гаджетах и технологиях.

✔ ПОДПИСАТЬСЯ НА МТС Редспот