Генерация текста внутри изображений долгое время оставалась слабым местом нейросетей. Даже при хорошем визуальном качестве надписи часто получались искажёнными, нечитаемыми или случайными. С появлением специализированных моделей ситуация изменилась, и сегодня чаще всего сравнивают Ideogram и Imagen как инструменты, лучше других справляющиеся с текстом на картинках. Ideogram изначально разрабатывался с упором на генерацию читаемого текста. Это заметно уже в базовых сценариях использования. Модель хорошо подходит для: Текст чаще всего: Однако при сложной верстке или длинных предложениях качество может снижаться. Imagen в первую очередь ориентирован на общее качество изображения, композицию и стиль. Работа с текстом для него — вторичная задача. Модель лучше справляется с: При этом: Imagen больше подходит для случаев, где текст не является ключевым элементом изображения.