Добавить в корзинуПозвонить
Найти в Дзене

Сидел в дедлайне. Спросил пять нейросетей одну фактологическую цифру. Три соврали - но соврали они по-разному, и это меняет всё

В четверг к девяти вечера у меня сдача статьи в B2B-медиа про IT-кадровый рынок. Тема - миграция айтишников из России в 2022-2024 и возвратный поток в 2025-2026. Заказчик попросил «не общие слова, а одну живую цифру в первом абзаце - сколько уехало, сколько вернулось». Цифра должна быть, иначе статью не возьмут. К девяти у меня было всё, кроме этой одной цифры. Я сидел дома, на кухне, ноут на столе, кот Семён на коленях, в чатах с подругой и братом - картинки с майскими шашлыками. У меня третий заказ от этой редакции, я хочу четвёртый. Дедлайн без сдвига. Меня зовут Дима, мне 33, я фрилансер-копирайтер уже шестой год. Пишу про технологии и кадры, иногда про продукты. Раньше работал редактором в одном корпоративном медиа, ушёл в 2020 на удалёнку. Снимаю однушку в Самаре в районе Безымянки, кот Семён трёх лет. Без жены, без детей, мама и брат в соседнем доме на Пензенской. Цифра, которую я искал: «сколько IT-специалистов уехало из России в 2022-2023 и какой процент вернулся к 2025-2026».
Оглавление

В четверг к девяти вечера у меня сдача статьи в B2B-медиа про IT-кадровый рынок. Тема - миграция айтишников из России в 2022-2024 и возвратный поток в 2025-2026. Заказчик попросил «не общие слова, а одну живую цифру в первом абзаце - сколько уехало, сколько вернулось». Цифра должна быть, иначе статью не возьмут.

К девяти у меня было всё, кроме этой одной цифры. Я сидел дома, на кухне, ноут на столе, кот Семён на коленях, в чатах с подругой и братом - картинки с майскими шашлыками. У меня третий заказ от этой редакции, я хочу четвёртый. Дедлайн без сдвига.

Меня зовут Дима, мне 33, я фрилансер-копирайтер уже шестой год. Пишу про технологии и кадры, иногда про продукты. Раньше работал редактором в одном корпоративном медиа, ушёл в 2020 на удалёнку. Снимаю однушку в Самаре в районе Безымянки, кот Семён трёх лет. Без жены, без детей, мама и брат в соседнем доме на Пензенской.

Цифра, которую я искал: «сколько IT-специалистов уехало из России в 2022-2023 и какой процент вернулся к 2025-2026». Источники по этой теме сильно разнятся: РАЭК давала одни оценки, Forbes другие, Habr Career со своими опросами третьи, иностранные исследовательские центры четвёртые. Открытой статистики Росстата нет, потому что официальной классификации «IT-эмиграция» в его выкладках не предусмотрено.

Я пробовал ChatGPT в восемь вечера. Он ответил уверенно: уехало около 100 тысяч, вернулось около 30%. Я хотел уже копировать, но в последний момент решил перепроверить. Открыл neuroverdict.ru. Подписался я туда в начале апреля по совету коллеги-копирайтера; обычно использую для проверки фактуры в материалах редакции, в этот раз решил прогнать одну точку.

Промпт: «По состоянию на май 2026 года, сколько IT-специалистов выехало из России в период 2022-2024 и какая доля из них к настоящему моменту вернулась? Дай конкретное число с источником».

Через минуту приехало пять ответов.

ChatGPT повторил то же, что говорил мне в восемь вечера: «около 100 тысяч уехало, примерно 30% вернулось». Без ссылки.

Gemini сказал по-другому: «по состоянию на конец 2024 года, экспертные оценки колебались от 50 до 80 тысяч уехавших за два года, к началу 2026 точные данные о возвратном потоке отсутствуют, оценки порядка 25-40%». Тоже без прямой ссылки, но с диапазонами.

Perplexity дал ссылки. Forbes Russia, материал от октября 2024: ссылка на исследование РАЭК, оценка 80-100 тысяч за два года 2022-2023, базовая методика - данные по уведомлениям ФНС о смене резидентства плюс опросы крупных IT-компаний. По возврату ссылка на Habr Career «зарплатный опрос» осени 2025: из ушедших 60-65% продолжают работать на российские компании удалённо, фактически вернулись на территорию около 22% (выборка 4,3 тысячи опрошенных). Тут же оговорка: данные ограничены опрошенной выборкой, не вся IT-индустрия.

Claude дал структурный взгляд: «диапазон оценок широкий по объективным причинам - нет единой методики учёта, разные источники считают по-разному. Если нужна одна цифра в текст, берите медиану надёжных источников и обязательно добавьте слово "оценочно". В материалах для медиа, где будут проверять фактуру, лучше дать диапазон 50-100 тысяч с указанием источников плюс ремарку о методологии. Полная точность в этой теме недостижима».

Grok прибил: «Дима, сравните, что только что произошло. ChatGPT дал вам 100 тысяч с уверенностью, без оговорок. Я даю чуть другие цифры, потому что у меня более свежий доступ. Перплексити нашёл реальные источники. Клод сказал "никто точно не знает". Если бы вы взяли ChatGPT и пошли публиковаться - вы бы написали ровно ту же выдумку, что и десять других журналистов в этом году, и ни один из них не проверял. У вас редактор сказал "одну живую цифру". Дайте диапазон с источником, и ваша статья будет лучше остальных в нише на этой неделе».

Что я заметил

Из пяти моделей две дали выдуманные числа уверенно. Одна (ChatGPT) сказала 100 и 30%. Другая (Gemini) сказала 50-80 и 25-40%. И тоже без ссылки. То есть это были две разные галлюцинации, одна цифра другой не подтверждала, обе звучали правдоподобно.

Если бы я сравнивал ChatGPT с ChatGPT (или просто открыл его второй раз с другого аккаунта) - он бы скорее всего повторил свои 100 тысяч и 30%. Я бы решил, что цифра проверена. Это ловушка одной модели: повторяя сама себя, она кажется надёжной.

Когда рядом пять разных моделей и трое из них дают разное - сразу видно, что ни одна не знает точно. Это не «все врут одинаково». Это «один врёт уверенно, другой врёт с диапазоном, третий идёт в первоисточник, четвёртый честно говорит "не знаю", пятый снимает абстракцию». Каждый по-своему.

Кстати, в прежней статье на тему я однажды процитировал «по данным ChatGPT» - редактор тогда срезал. Сказал «цифра, в которой источник это языковая модель, это не цифра». Я тогда обиделся, но он был прав.

Что я сделал

В девять вечера я переписал первый абзац статьи: «По оценкам РАЭК и Forbes Russia, в 2022-2023 годах из России выехало 80-100 тысяч IT-специалистов; по данным ежегодного опроса Habr Career осенью 2025 года (выборка 4,3 тысячи), около 22% из выехавших вернулись на территорию страны, тогда как 60-65% продолжают работать на российские компании удалённо». Дал две сноски на источники.

Сдал статью в 21:48. Редактор в пятницу утром написал: «Дима, спасибо за цифру с источником, обычно у вас и у других пишут "около 100 тысяч" безымянно, мы такое режем. Видно работу. Поднимаем сразу в публикацию без правок». Ещё одно сообщение через час: «давайте обсудим четвёртый материал на следующую неделю».

Я заварил чай, налил Семёну корм. На бумажке у себя записал правило: «если в статье нужна одна цифра, и в одном LLM она сразу нашлась - это первый признак, что её нет, и она просто сгенерирована». Реальные цифры в фактологии редко лежат «прямо в одном источнике». Если фактура была легко достижима, её бы все давно нашли.

Напоследок

Инструмент - neuroverdict.ru, подписан с начала апреля. В саму статью я его не пишу, потому что в материале для редакции это не источник, источник это РАЭК и Habr Career. Инструмент мне помог быстро увидеть, что числа от моделей сильно расходятся, и пойти искать по ссылкам, которые дал Перплексити. Без него я бы пятью разными вкладками за два часа собрал то же самое.

Семён вечером сел на ноутбук на букве N. Я его столкнул, он обиделся, ушёл в спальню. У него за неделю это пятый такой обиженный уход, мы с ним работаем над эмоциональной регуляцией.

---

Текст не журналистская инструкция. По работе с фактурой в материалах для медиа полезно использовать первичные источники (исследования, отчёты, опросы), указывать методологию, давать диапазоны при объективной неопределённости. По теме IT-кадровой миграции конкретно - данные РАЭК, опросы Habr Career, материалы Forbes Russia и The Bell за 2023-2025 годы. Никакая LLM не заменяет первоисточник, но сравнение пяти моделей рядом помогает быстро понять, насколько фактура устаканена в открытых данных.