Google представила нейросеть Imagen, которая создаёт изображения по небольшому описанию. Вместе с этим компания показала примеры работ, которые по качеству превосходят DALL-E 2.
Стоит учитывать, что для демонстрации Google отбирает самые лучшие работы, поэтому средний результат у пользователей может оказаться другим. Даже в показанных изображениях, которые сгенерировала Imagen, можно найти смазанные места и неверный фокус.
Проблемы других нейросетей заключаются в том, что они неправильно оценивают текст и подсказки в нём, из-за чего результат получается неожиданный. Google утверждает, что Imagen будет лучше благодаря бенчмарку DrawBench. В нём можно найти список фраз, которые загружаются в нейросеть для получения корректного результата.
Google пока не планирует делать Imagen общедоступной из-за предубеждений и вероятности создания изображений с жестокостью. Согласно данным исследователей, модель копирует информацию со стереотипами. Из-за этого публичный релиз не состоится, пока комп