Найти в Дзене
78 подписчиков

RAPHAEL — новая text-2-image модель, создающая высокохудожественные изображения, точно следуя промтам (включая существительные, прилагательные и глаголы). При этом текст на генерациях хорошо читается.


RAPHAEL использует смесь экспертных слоев (mixture-of-experts или MoE) для создания миллиардов диффузионных каналов. Каждый такой канал можно представить как "художника", который рисует определенную часть изображения.

Модель RAPHAEL превосходит Stable Diffusion, ERNIE-ViLG 2.0, DeepFloyd и DALL-E 2 по качеству изображения и эстетической привлекательности. И может соперничать с Midjourney.

Кода пока нет.

P.S. как-то мало данных и шума вокруг проекта. Но будем держать руку на пульсе.

Больше интересностей у меня в телеге Psy Eyes.
Около минуты