17 подписчиков

Какие нейросети лучше всего пишут русский текст (кириллицу) на картинке: тест 2025 года

8 ноября 20258 ноя 2025

244

3 мин

В эпоху генеративного ИИ создание изображений по текстовому описанию стало повседневностью. Но есть нюанс: многие модели, обученные преимущественно на латинице, путают или искажают кириллицу. Буквы "б" превращаются в "6", "р" - в "p", а целые слова — в абстрактные каракули. В этой статье мы протестировали шесть популярных нейросетей: ChatGPT (с DALL-E 3), Gemini (с Imagen), Grok (с Flux), GigaChat и Alisa AI (с YandexART). Тест проводился в ноябре 2025 года на простом промпте: "Создай изображение с надписью 'Алиса, поздравляю тебя с Днем Рождения!' на русском языке в стиле советской открытки". Мы оценивали читаемость текста, точность символов и общую эстетику. Результаты основаны на реальных генерациях и обзорах из открытых источников. Методология теста Теперь разберём каждую модель. ChatGPT - ветеран в генерации изображений, интегрированный в чат OpenAI. DALL-E 3 известен креативностью, но с кириллицей у него были проблемы: модель "переводит" русские буквы в похожие латинские. Результ

Оглавление

1. ChatGPT (DALL-E 3 от OpenAI)
2. Gemini (Imagen 3 от Google)
3. Grok (Flux.1 от xAI/Black Forest Labs)

Методология теста

Промпт: Указан выше, чтобы фокус был на кириллице ("Создай изображение с надписью 'Алиса, поздравляю тебя с Днем Рождения!").
Критерии оценки (по 10-балльной шкале):Читаемость текста: насколько легко разобрать слова.
Точность кириллицы: отсутствие искажений букв.
Эстетика: соответствие стилю и качество изображения.
Доступность: Все тесты бесплатны или на базовых тарифах.

Теперь разберём каждую модель.

1. ChatGPT (DALL-E 3 от OpenAI)

ChatGPT - ветеран в генерации изображений, интегрированный в чат OpenAI. DALL-E 3 известен креативностью, но с кириллицей у него были проблемы: модель "переводит" русские буквы в похожие латинские.

Результат теста:

С текстом: 'Алиса, поздравляю тебя с Днем Рождения!" модель справилась
Читаемость: 10/10.
Точность кириллицы: 10/10
Эстетика: 8/10 - плакат получился ярким и стилизованным под агитпроп.

2. Gemini (Imagen 3 от Google)

Gemini - мультимодальный ассистент Google, с 2025 года обновлённый до версии 2.5 Pro с улучшенной генерацией изображений. Imagen 3 лучше справляется с текстом благодаря дообучению на разнообразных данных, включая не-латинские скрипты.

Результат теста:

Текст: "Алиса, поздравляю тебя с Днем Рождения!" - почти справилась, только на слове "поздравляю" у модели пошли глюки.
Читаемость: 10/10 — текст чёткий, без искажений.
Точность кириллицы: 7/10 — прогресс заметен, но в сложных шрифтах (как агитпроп) бывают мелкие артефакты.
Эстетика: 9/10 — высокое разрешение, реалистичные цвета и детали.

3. Grok (Flux.1 от xAI/Black Forest Labs)

Grok - ИИ от xAI, с интеграцией Flux., которая с лета 2024 года хвалится точной отрисовкой текста, включая кириллицу. Flux обучен на огромном датасете с фокусом на типографику.

Результат теста:

Текст: "Алиса, поздравляю тебя с Днем Рождения!" - почти справилась, только на слове "поздравляю" у модель небольшая ошибка, пропущена буква "я".
Читаемость: 10/10 - как будто напечатан в типографии.
Точность кириллицы: 9/10 - редкие случаи "ломания" слов в сложных стилях, но в нашем тесте всё ок.
Эстетика: 7/10 - плакат как-то не похож на советскую открытку.
Итог: Топ по тексту. Flux лидирует в 2025 году среди открытых моделей для не-английского контента. Доступен бесплатно на x.com и в приложениях.

4. GigaChat (от Сбера)

GigaChat — российская нейросеть, заточенная под русский язык. С 2025 года обновлена до версии 2.0 с улучшенной генерацией изображений на базе Kandinsky и собственных моделей. Недавно научилась добавлять текст на картинки.

Результат теста:

С текстом: 'Алиса, поздравляю тебя с Днем Рождения!" модель справилась.
Читаемость: 10/10 - минимальные шумы на фоне.
Точность кириллицы: 10/10 - как родная для модели.
Эстетика: 8/10 - непонятный агитпроп, в открытку зачем-то добавлена георгиевская ленточка.

6. Alisa AI (YandexART от Яндекса)

Alisa — голосовой ассистент Яндекса с мультимодальными возможностями. YandexART — их генератор изображений, обученный на русском контенте.

Результат теста:

С текстом: 'Алиса, поздравляю тебя с Днем Рождения!" модель не справилась.
Читаемость: 4/10 - текст почти не читается на плакате.
Точность кириллицы: 4/10 .
Эстетика: 3/10 - после такой открытки, с вами вряд ли будут разговаривать)).

Вывод: Кто победил?

Для работы с русским текстом на кириллице наиболее эффективными являются ChatGPT и GigaChat, которые демонстрируют 100% точность благодаря локальному обучению. Следом за ними идут Grok с Flux, которые особенно хороши для создания креативного контента без цензуры. Gemini - универсальный инструмент, подходящий для решения глобальных задач. Однако для работы с кириллицей не стоит использовать Алису, так как эта модель показала наихудшие результаты. Возможно, в будущих обновлениях Алиса будет оптимизирована для работы с кириллическим текстом, учитывая, что это российская GPT.

А вы пробовали генерировать кириллицу? Поделитесь в комментариях.