57 подписчиков

8 ошибок при работе с GigaChat и YandexGPT: почему промпты не работают

12 мая12 мая

5 мин

74% российских специалистов уже используют ИИ в работе. Но большинство получает от GigaChat и YandexGPT шаблонный текст и ошибки. Дело не в моделях, а в восьми типичных ошибках. Российские LLM от Сбера и Яндекса в 2026 году подтянулись к зарубежным аналогам по русскому языку. По данным Яндекса, YandexGPT 5.1 Pro даёт качественные ответы в 71% случаев против 60% у предыдущей версии. GigaChat 2 MAX лидирует среди российских моделей в бенчмарке MERA. Но пользователи всё равно жалуются на «воду», галлюцинации и шаблонный текст. Причина почти всегда в промпте. ОШИБКА 1. ЗАПРОС БЕЗ РОЛИ И КОНТЕКСТА Самый массовый паттерн: пользователь пишет «Напиши статью про кофе» и ждёт чуда. Получает шаблонный текст. Курсы СберУниверситета по работе с GigaChat прямо предупреждают: модель не понимает смысл языка, она реагирует на формулировку. Что делать. Указывать роль, формат, длину и аудиторию прямо в промпте. Вместо «Напиши статью про кофе» сработает: «Ты редактор делового издания, напиши колонку на 2

Российские LLM от Сбера и Яндекса в 2026 году подтянулись к зарубежным аналогам по русскому языку. По данным Яндекса, YandexGPT 5.1 Pro даёт качественные ответы в 71% случаев против 60% у предыдущей версии. GigaChat 2 MAX лидирует среди российских моделей в бенчмарке MERA. Но пользователи всё равно жалуются на «воду», галлюцинации и шаблонный текст. Причина почти всегда в промпте.

ОШИБКА 1. ЗАПРОС БЕЗ РОЛИ И КОНТЕКСТА

Самый массовый паттерн: пользователь пишет «Напиши статью про кофе» и ждёт чуда. Получает шаблонный текст. Курсы СберУниверситета по работе с GigaChat прямо предупреждают: модель не понимает смысл языка, она реагирует на формулировку.

Что делать. Указывать роль, формат, длину и аудиторию прямо в промпте. Вместо «Напиши статью про кофе» сработает: «Ты редактор делового издания, напиши колонку на 2000 знаков о вреде кофе для офисных сотрудников, тон сдержанный».

ОШИБКА 2. ИГНОРИРОВАНИЕ СИСТЕМНОГО ПРОМПТА

В API обеих моделей есть отдельная рол system. Это инструкция, которая задаёт поведение, стиль и рамки. В документации Yandex Cloud она используется в каждом примере: сначала идёт system-сообщение «Найди ошибки в тексте и исправь их», потом само user-сообщение. Большинство пользователей всю инструкцию запихивают в user и удивляются, что модель забывает правила к третьему ответу.

Что делать. В API задавать роль отдельным system-сообщением. В веб-интерфейсе GigaChat и Алисы Pro выносить эту инструкцию в первое сообщение и ссылаться на неё при отклонениях.

ОШИБКА 3. НЕВЕРНАЯ ТЕМПЕРАТУРА ДЛЯ ЗАДАЧИ

Параметр temperature управляет вариативностью ответа. У YandexGPT диапазон от 0 до 1, значение по умолчанию 0,6. У GigaChat диапазон похожий. Пользователи обычно не трогают этот параметр и потом удивляются, почему модель фантазирует в юридическом документе или выдаёт скучный текст в маркетинговой задаче.

Грубый ориентир для обеих моделей:

- 0,1–0,3: точные задачи. Суммаризация, извлечение фактов, юридические тексты, классификация.

- 0,4–0,6: стандартные тексты, ответы на вопросы, инструкции.

- 0,7–0,9: креатив. Реклама, сценарии, идеи.

Чем выше температура, тем выше риск галлюцинаций. У YandexGPT 5.1 Pro доля выдуманных данных по собственным замерам Яндекса около 16%, и температура её усиливает.

ОШИБКА 4. ПЕРЕОЦЕНКА КОНТЕКСТНОГО ОКНА

GigaChat 2 в 2025 году расширил контекст до 128 тысяч токенов, это примерно 200 страниц A4. У YandexGPT 5 Pro окно поменьше, около 32 тысяч токенов. На бумаге впечатляет. На практике обе модели начинают терять детали из середины длинного промпта.

Что делать. Не закидывать в один запрос весь договор и все вопросы скопом. Разбивать на блоки: один блок текста, один вопрос. И помнить, что 1 токен у GigaChat в среднем равен 3–4 символам, по официальной справке Сбера.

ОШИБКА 5. ОДИН ПРОМПТ БЕЗ ИТЕРАЦИЙ

Многие думают, что хороший промпт пишется сразу. На деле любая работа с LLM, это диалог в 3–5 итераций. Habr-обзоры по промпт-инжинирингу советуют простой приём: после ответа писать модели «Перепроверь свой ответ, убедись, что он не содержит ошибок и неточностей». Качество растёт заметно.

Что делать. Не закрывать диалог после первого ответа. Просить модель проверить себя, переписать с другой стороны, привести альтернативу.

ОШИБКА 6. ПРОВЕРКА ФАКТОВ ДОВЕРЕНА МОДЕЛИ

Самая дорогая ошибка из всего списка. Тест компании SimbirSoft на Habr показал: при суммаризации текстов GigaChat в два раза чаще, чем YandexGPT, придумывает или додумывает факты. В пересказе первой главы «Собачьего сердца» модель приписывала собаке имя Полиграф Полиграфович, хотя в этом фрагменте такого имени ещё не было. YandexGPT тоже галлюцинирует, просто реже.

Что делать. Любые цифры, даты, имена и цитаты, которые выдала модель, сверять с первоисточником. Особенно в новостях и юридических текстах.

ОШИБКА 7. ИГНОРИРОВАНИЕ ВСТРОЕННЫХ ФИЛЬТРОВ

В документации GigaChat прямо сказано: запрос, который попадает под ограничения, возвращает поле finish_reason: "blacklist", и модель не отвечает. Часто это срабатывает на безобидных формулировках со словами «как взломать алгоритм Дзена», «как украсть внимание читателя».

Что делать. Если ответ оборвался, переформулировать без триггерных слов. «Как взломать алгоритм Дзена» меняем на «Как разобраться в принципах ранжирования Дзена». YandexGPT мягче, но и у него есть свои фильтры.

ОШИБКА 8. ВЫБОР МОДЕЛИ БЕЗ ОЦЕНКИ ЗАДАЧИ

Внутри одной экосистемы есть несколько версий, и они сильно различаются по цене и качеству. У GigaChat это Lite, Pro и MAX. У Яндекса YandexGPT 5 Lite и YandexGPT 5.1 Pro. По официальной информации Сбера, GigaChat 2 Lite сопоставим с предыдущей версией Pro. Использовать MAX для рерайта одного абзаца, это переплата за токены.

Что делать. Простые задачи (рерайт, классификация, выжимка короткого текста) отдавать Lite-версиям. Сложная аналитика и длинный контекст: Pro и MAX. Разница в цене между Lite и MAX может быть в десятки раз.

ЧТО В ИТОГЕ

Большая часть жалоб на «слабость» российских нейросетей объясняется не моделями, а тем, как их используют. По данным Яндекса, переход с YandexGPT 4 на 5.1 Pro снизил долю выдуманных данных почти вдвое, до 16%. Инструменты есть, не хватает дисциплины в промптах.

Главные выводы:

- Промпт без роли и формата всегда даёт средний результат.

- Системный промпт, температура и выбор версии меняют качество ответа сильнее, чем переключение между GigaChat и YandexGPT.

- Любые факты от LLM это черновик, а не источник.

Что делать тем, кто работает с российскими LLM каждый день:

1. Завести шаблоны промптов под типовые задачи: с ролью, форматом и температурой под задачу.

2. В API всегда использовать отдельное system-сообщение, в веб-версии фиксировать инструкцию первым сообщением.

3. Длинные тексты разбивать на блоки, а не на одно гигантское сообщение.

4. Числа, даты и имена из ответа сверять с первоисточником, особенно перед публикацией.

5. Раз в квартал перечитывать документацию Сбера и Яндекса. Версии меняются.

10 бесплатных курсов по ИИ от Сбера, Яндекса и ВШЭ в 2026

ИИ для карьеры, а не для хайпа11 мая

Эффект миддла: 5 причин, почему опытные специалисты идут на места джунов в 2026

ИИ для карьеры, а не для хайпа10 мая