Компания «Яндекс» представила новую диффузионную нейросеть YandexART 2.0. Благодаря переходу на новую гибридную архитектуру, она стала гораздо лучше и точнее генерировать изображения. Разработчики рассказали, как они обучали нейросеть и какие технологии применяли для её улучшения. «Новая модель умеет создавать надписи прямо на изображениях, придерживаться нескольких стилей на одной картинке, располагать объекты в пространстве и относительно друг друга более естественно и учитывать при генерации больше деталей из текстового запроса», — рассказал Евгений Ляпустин из команды компьютерного зрения «Яндекса». По словам Евгения, ранее они использовали классический вариант свёрточной архитектуры U-Net, применяемой в DALL-E 2, Imagen и других популярных нейросетях. Разработчики экспериментировали с трансформерами (Stable Diffusion 3 и FLUX), которые позволяют учитывать длинный контекст, но результат их не удовлетворил. В итоге они создали собственную гибридную архитектуру, объединяющую достоинс
Новая нейросеть YandexART 2.0 теперь генерирует более реалистичные изображения
10 октября 202410 окт 2024
169
1 мин