Найти тему
Телеспутник

«Яндекс» представил нейросеть YandexART для создания изображений

«Яндекс» представил диффузионную нейросеть Yandex AI Rendering Technology (YandexART), которой известен российский культурный код, она может создавать изображения и анимации в ответ на запросы пользователей. Об этом сообщили в пресс-службе компании.

Нейросеть понимает российский культурный код — знает известные места и города страны, выдающихся личностей разных эпох и знакомых с детства персонажей мультфильмов и сказок. Например, Чебурашку, богатырей и Бабу-Ягу. Нейросеть уже интегрирована в приложение «Шедеврум» и помогает иллюстрировать рекламные объявления в «Яндекс Бизнесе», а вскоре появится в «Клавиатуре» и других сервисах компании. «По сравнению с предыдущим поколением диффузионной модели, которая использовалась в "Шедевруме", YandexART создает более реалистичную и детализированную графику. По итогам внутренней оценки асессоров ее результаты лучше в 60 % случаев», — добавили в «Яндексе».

YandexART формирует изображения и анимацию методом каскадной диффузии: сначала нейросеть генерирует картинки и кадры в соответствии с запросом пользователя, а затем поэтапно увеличивает их разрешение, насыщая деталями.

Для улучшения качества работы нейросети разработчики увеличили размер обучающего набора данных в 1,5 раза — до 330 миллионов картинок с текстовым описанием. Для обучения YandexART используются самые эстетичные картинки — они отбираются при помощи трёх режимов фильтрации. Новый алгоритм распознавания текстов помогает нейросети лучше понимать пожелания пользователей. Кроме того, нейросеть качественнее прорабатывает особенности лиц, глаз и рук, что позволяет ей делать фотореалистичные портреты.

Для улучшения качества генерации используется дообучение с подкреплением. Специалисты компании отсматривают, например, сразу несколько сотен или тысяч созданных с помощью YandexART капибар и отмечают удачные и неудачные изображения. Это позволяет нейросети понять, как именно лучше и правильнее изображать животных, персонажей, объекты, явления и не только.

Ранее «Телеспутник» писал, что «Яндекс» запустил YandexGPT 2. Новая языковая модель может решать больше различных типов задач, чем первая версия нейросети, а качество её ответов существенно улучшилось. Она отвечает лучше в 67 % случаев по сравнению с первой версией нейросети.