Добавить в корзинуПозвонить
Найти в Дзене
Нейрозона сегодня

GLM-Image: Китайская модель для генерации изображений стала открытой

Китайская компания Zhipu AI представила открытую модель для генерации изображений GLM-Image, поддерживающую режимы text-to-image и image-to-image. На момент публикации модель доступна для использования через API и на платформе Hugging Face, но не интегрирована на основной сайт z.ai, где временно отключена старая версия. На z.ai можно бесплатно протестировать текстовую модель GLM, демонстрирующую достойное качество. Тестирование на fal.ai показало значительное улучшение в генерации китайских иероглифов – символы отображаются четко и без искажений. Вероятно, это результат масштабного обучения на изображениях с китайским текстом. К сожалению, модель испытывает трудности с кириллицей, пытаясь заменить ее транслитом. Культурный контекст также преимущественно китайский, что отражается в необычных деталях на сгенерированных изображениях, например, в традиционных головных уборах на футболистах или в преобладании матрешек. Разработчики утверждают, что GLM-Image эффективно работает как редактор

Китайская компания Zhipu AI представила открытую модель для генерации изображений GLM-Image, поддерживающую режимы text-to-image и image-to-image.

На момент публикации модель доступна для использования через API и на платформе Hugging Face, но не интегрирована на основной сайт z.ai, где временно отключена старая версия. На z.ai можно бесплатно протестировать текстовую модель GLM, демонстрирующую достойное качество.

Тестирование на fal.ai показало значительное улучшение в генерации китайских иероглифов – символы отображаются четко и без искажений. Вероятно, это результат масштабного обучения на изображениях с китайским текстом.

К сожалению, модель испытывает трудности с кириллицей, пытаясь заменить ее транслитом. Культурный контекст также преимущественно китайский, что отражается в необычных деталях на сгенерированных изображениях, например, в традиционных головных уборах на футболистах или в преобладании матрешек.

Разработчики утверждают, что GLM-Image эффективно работает как редактор изображений и для создания коммерческих промо-материалов. Открытый доступ к API и весам модели, вероятно, привлечет широкое сообщество пользователей.

Ссылки:

HF: https://huggingface.co/zai-org/GLM-Image

GitHub: https://github.com/zai-org/GLM-Image

Документация к API: https://docs.z.ai/guides/image/glm-image

И, конечно, не забудьте подписаться на мой канал, чтобы поддержать дальнейшие исследования в области машинного обучения. Ведь кто еще будет рассказывать вам о таких прорывах, если не я?