77 подписчиков

Галлюцинации ИИ: что это и почему происходят?

24 ноября 202524 ноя 2025

2 мин

Вы спрашиваете ChatGPT: "Когда родился Пушкин?"

Он отвечает: "6 июня 1799 года."

Вы уточняете: "А точно 6 июня?"

Он извиняется: "Простите, 26 мая 1799 года по старому стилю." 🤔 Откуда эта неуверенность? ChatGPT (без интернета) не гуглит в момент ответа. У него нет доступа к базам данных. Он работает как вы после прочтения 10,000 книг без фотопамяти. 📚 Модель обучалась на 300 миллиардах слов из интернета. Она запомнила паттерны, но не факты дословно. Когда вы спрашиваете про Пушкина, модель вспоминает: "Я видела фразу 'Пушкин родился 6 июня 1799' в 800 текстах и '26 мая 1799' в 200 текстах." Она выбирает вариант, который встречала чаще. Это не знание — это статистика. Когда вы пишете "Александр Сергеевич Пушкин родился...", модель рассчитывает: Она выбирает 78%. Не потому что "знает" правду, а потому что эту последовательность слов видела чаще всего. 💼 Пример с вашим вопросом: Вы: "Сколько стоит интеграция Salesforce?" AI думает: Выберет первое. Хотя для вашей компании ответ может б

Вы спрашиваете ChatGPT: "Когда родился Пушкин?"

Он отвечает: "6 июня 1799 года."

Вы уточняете: "А точно 6 июня?"

Оглавление

Почему ChatGPT иногда врёт (и что с этим делать)
Как AI "запоминает" информацию
Что значит "наиболее вероятное продолжение"

Почему ChatGPT иногда врёт (и что с этим делать)

Вы спрашиваете ChatGPT: "Когда родился Пушкин?"
Он отвечает: "6 июня 1799 года."
Вы уточняете: "А точно 6 июня?"
Он извиняется: "Простите, 26 мая 1799 года по старому стилю."

🤔 Откуда эта неуверенность?

Как AI "запоминает" информацию

ChatGPT (без интернета) не гуглит в момент ответа. У него нет доступа к базам данных. Он работает как вы после прочтения 10,000 книг без фотопамяти.

📚 Модель обучалась на 300 миллиардах слов из интернета. Она запомнила паттерны, но не факты дословно. Когда вы спрашиваете про Пушкина, модель вспоминает: "Я видела фразу 'Пушкин родился 6 июня 1799' в 800 текстах и '26 мая 1799' в 200 текстах."

Она выбирает вариант, который встречала чаще. Это не знание — это статистика.

Что значит "наиболее вероятное продолжение"

Когда вы пишете "Александр Сергеевич Пушкин родился...", модель рассчитывает:

Вероятность что дальше идёт "6 июня" — 78%
Вероятность "26 мая" — 19%
Вероятность другой даты — 3%

Она выбирает 78%. Не потому что "знает" правду, а потому что эту последовательность слов видела чаще всего.

💼 Пример с вашим вопросом:

Вы: "Сколько стоит интеграция Salesforce?"

AI думает:

"стоит от $50,000" — 40% (видел в блогах)
"стоит от $100,000" — 35% (видел в кейсах)
"стоит от $25,000" — 25% (видел на форумах)

Выберет первое. Хотя для вашей компании ответ может быть третьим.

Конфликтующая информация

В интернете одно событие описано по-разному. 🚀 Про запуск SpaceX Starship:

Статьи 2023: "3 провала подряд"
Статьи 2024: "2 успешных теста"

Модель видела ОБЕ версии. Какую выдать?

📊 Она считает частоту упоминаний. Если "успешные тесты Starship" встречалось 12,000 раз, а "провалы Starship" 4,000 раз — выдаст первое.

⚠️ Проблема: популярное ≠ правильное.

Почему Reddit "весит" больше MIT

📈 Reddit — источник №1 для AI (40% всех цитат), Wikipedia — №2 (26%). Научные журналы MIT? Где-то далеко внизу.

Не потому что модель "думает", что Reddit умнее. Просто Reddit обсуждал AI 500,000 раз, а MIT опубликовал 50 статей.

💡 Модель не понимает "авторитетность". Для неё текст = текст. Если что-то повторили 10,000 раз на форумах, это "весит" больше, чем научная работа, которую процитировали 100 раз.

Поэтому AI уверенно пересказывает городские легенды.

Что делать вам

🎯 Уточняйте контекст:

❌ "Сколько стоит CRM?"
✅ "Сколько стоит Salesforce для 50 сотрудников в России с интеграцией 1С?"

Чем конкретнее вопрос, тем меньше "угадывания".

🔍 Просите источники:

"Откуда эта цифра? Назови конкретное исследование или компанию."

Если AI ссылается на "исследование 2023 года" без названия — он угадывает.

✔️ Проверяйте критичное сами:

❌ Бюджет для отчёта → AI черновик → в отчёт
✅ Бюджет для отчёта → AI черновик → Гугл → проверка → в отчёт

❌ Юридический совет → ChatGPT
✅ Юридический совет → Консультант

❌ Медицинские рекомендации → AI
✅ Медицинские рекомендации → Врач

AI отлично пишет черновики. Но факты — ваша ответственность.

🌐 Современные AI с поиском

ChatGPT, Claude и другие теперь МОГУТ искать в интернете — но только когда явно используют эту функцию. Базовый режим всё ещё работает на "памяти" из обучения.

Когда видите "Searching the web..." — это уже не угадывание, это реальный поиск. Но и тут AI выбирает, каким источникам верить, по тому же принципу: частота упоминаний.

🎯 Итог

AI — это не энциклопедия. Это статистическая машина, которая угадывает следующее слово на основе того, что видела чаще всего.

✅ Используйте для: драфтов, идей, структуры текста
❌ Не используйте для: финальных цифр, юридических решений, медицинских диагнозов