Добавить в корзинуПозвонить
Найти в Дзене
it_uni

Какие нейросети лучше всего пишут русский текст (кириллицу) на картинке: тест 2025 года

В эпоху генеративного ИИ создание изображений по текстовому описанию стало повседневностью. Но есть нюанс: многие модели, обученные преимущественно на латинице, путают или искажают кириллицу. Буквы "б" превращаются в "6", "р" - в "p", а целые слова — в абстрактные каракули. В этой статье мы протестировали шесть популярных нейросетей: ChatGPT (с DALL-E 3), Gemini (с Imagen), Grok (с Flux), GigaChat и Alisa AI (с YandexART). Тест проводился в ноябре 2025 года на простом промпте: "Создай изображение с надписью 'Алиса, поздравляю тебя с Днем Рождения!' на русском языке в стиле советской открытки". Мы оценивали читаемость текста, точность символов и общую эстетику. Результаты основаны на реальных генерациях и обзорах из открытых источников. Методология теста Теперь разберём каждую модель. ChatGPT - ветеран в генерации изображений, интегрированный в чат OpenAI. DALL-E 3 известен креативностью, но с кириллицей у него были проблемы: модель "переводит" русские буквы в похожие латинские. Результ
Оглавление

В эпоху генеративного ИИ создание изображений по текстовому описанию стало повседневностью. Но есть нюанс: многие модели, обученные преимущественно на латинице, путают или искажают кириллицу. Буквы "б" превращаются в "6", "р" - в "p", а целые слова — в абстрактные каракули. В этой статье мы протестировали шесть популярных нейросетей: ChatGPT (с DALL-E 3), Gemini (с Imagen), Grok (с Flux), GigaChat и Alisa AI (с YandexART). Тест проводился в ноябре 2025 года на простом промпте: "Создай изображение с надписью 'Алиса, поздравляю тебя с Днем Рождения!' на русском языке в стиле советской открытки". Мы оценивали читаемость текста, точность символов и общую эстетику. Результаты основаны на реальных генерациях и обзорах из открытых источников.

Методология теста

  • Промпт: Указан выше, чтобы фокус был на кириллице ("Создай изображение с надписью 'Алиса, поздравляю тебя с Днем Рождения!").
  • Критерии оценки (по 10-балльной шкале):Читаемость текста: насколько легко разобрать слова.
    Точность кириллицы: отсутствие искажений букв.
    Эстетика: соответствие стилю и качество изображения.
  • Доступность: Все тесты бесплатны или на базовых тарифах.

Теперь разберём каждую модель.

1. ChatGPT (DALL-E 3 от OpenAI)

ChatGPT - ветеран в генерации изображений, интегрированный в чат OpenAI. DALL-E 3 известен креативностью, но с кириллицей у него были проблемы: модель "переводит" русские буквы в похожие латинские.

Результат теста:

  • С текстом: 'Алиса, поздравляю тебя с Днем Рождения!" модель справилась
  • Читаемость: 10/10.
  • Точность кириллицы: 10/10
  • Эстетика: 8/10 - плакат получился ярким и стилизованным под агитпроп.

2. Gemini (Imagen 3 от Google)

Gemini - мультимодальный ассистент Google, с 2025 года обновлённый до версии 2.5 Pro с улучшенной генерацией изображений. Imagen 3 лучше справляется с текстом благодаря дообучению на разнообразных данных, включая не-латинские скрипты.

-2

Результат теста:

  • Текст: "Алиса, поздравляю тебя с Днем Рождения!" - почти справилась, только на слове "поздравляю" у модели пошли глюки.
  • Читаемость: 10/10 — текст чёткий, без искажений.
  • Точность кириллицы: 7/10 — прогресс заметен, но в сложных шрифтах (как агитпроп) бывают мелкие артефакты.
  • Эстетика: 9/10 — высокое разрешение, реалистичные цвета и детали.

3. Grok (Flux.1 от xAI/Black Forest Labs)

Grok - ИИ от xAI, с интеграцией Flux., которая с лета 2024 года хвалится точной отрисовкой текста, включая кириллицу. Flux обучен на огромном датасете с фокусом на типографику.

-3

Результат теста:

  • Текст: "Алиса, поздравляю тебя с Днем Рождения!" - почти справилась, только на слове "поздравляю" у модель небольшая ошибка, пропущена буква "я".
  • Читаемость: 10/10 - как будто напечатан в типографии.
  • Точность кириллицы: 9/10 - редкие случаи "ломания" слов в сложных стилях, но в нашем тесте всё ок.
  • Эстетика: 7/10 - плакат как-то не похож на советскую открытку.
  • Итог: Топ по тексту. Flux лидирует в 2025 году среди открытых моделей для не-английского контента. Доступен бесплатно на x.com и в приложениях.

4. GigaChat (от Сбера)

GigaChat — российская нейросеть, заточенная под русский язык. С 2025 года обновлена до версии 2.0 с улучшенной генерацией изображений на базе Kandinsky и собственных моделей. Недавно научилась добавлять текст на картинки.

-4

Результат теста:

  • С текстом: 'Алиса, поздравляю тебя с Днем Рождения!" модель справилась.
  • Читаемость: 10/10 - минимальные шумы на фоне.
  • Точность кириллицы: 10/10 - как родная для модели.
  • Эстетика: 8/10 - непонятный агитпроп, в открытку зачем-то добавлена георгиевская ленточка.

6. Alisa AI (YandexART от Яндекса)

Alisa — голосовой ассистент Яндекса с мультимодальными возможностями. YandexART — их генератор изображений, обученный на русском контенте.

-5

Результат теста:

  • С текстом: 'Алиса, поздравляю тебя с Днем Рождения!" модель не справилась.
  • Читаемость: 4/10 - текст почти не читается на плакате.
  • Точность кириллицы: 4/10 .
  • Эстетика: 3/10 - после такой открытки, с вами вряд ли будут разговаривать)).

Вывод: Кто победил?

Для работы с русским текстом на кириллице наиболее эффективными являются ChatGPT и GigaChat, которые демонстрируют 100% точность благодаря локальному обучению. Следом за ними идут Grok с Flux, которые особенно хороши для создания креативного контента без цензуры. Gemini - универсальный инструмент, подходящий для решения глобальных задач. Однако для работы с кириллицей не стоит использовать Алису, так как эта модель показала наихудшие результаты. Возможно, в будущих обновлениях Алиса будет оптимизирована для работы с кириллическим текстом, учитывая, что это российская GPT.

А вы пробовали генерировать кириллицу? Поделитесь в комментариях.