В мире генерации изображений давно есть модели, которые отлично рисуют сцены — но заметно хуже справляются с текстом на картинках. Потому что создание красивого изображения и создание картинки с чёткими буквами и читаемым текстом — это две разные задачи. 14 января 2026 года компания Z.ai (ранее Zhipu AI) выпустила новую open-source модель GLM-Image — источник которой уже доступен широкому сообществу. Эта модель сочетает в себе сильное языковое понимание и визуальное качество, что по-сути решает задачу, с которой многие генераторы сталкиваются до сих пор. В отличие от классических моделей, которые просто интерпретируют запрос и рисуют картинку через диффузию, GLM-Image использует гибридную архитектуру: Это важно, потому что до сих пор многие генераторы: GLM-Image устраняет эту проблему, и по бенчмаркам уже показывает лучший результат по точности текста на картинках среди open-source моделей. GLM-Image позиционируется не как инструмент для художественного арт-контента, а как практичный и
GLM-Image: новая нейросеть для генерации изображений, которая умеет лучше работать с текстом
14 января14 янв
7
2 мин