Китайская компания Zhipu AI представила открытую модель для генерации изображений GLM-Image, поддерживающую режимы text-to-image и image-to-image. На момент публикации модель доступна для использования через API и на платформе Hugging Face, но не интегрирована на основной сайт z.ai, где временно отключена старая версия. На z.ai можно бесплатно протестировать текстовую модель GLM, демонстрирующую достойное качество. Тестирование на fal.ai показало значительное улучшение в генерации китайских иероглифов – символы отображаются четко и без искажений. Вероятно, это результат масштабного обучения на изображениях с китайским текстом. К сожалению, модель испытывает трудности с кириллицей, пытаясь заменить ее транслитом. Культурный контекст также преимущественно китайский, что отражается в необычных деталях на сгенерированных изображениях, например, в традиционных головных уборах на футболистах или в преобладании матрешек. Разработчики утверждают, что GLM-Image эффективно работает как редактор
GLM-Image: Китайская модель для генерации изображений стала открытой
17 января17 янв
3
1 мин