Найти тему

Сбер представил ruDALL-E — сеть для генерации картинок из текста

Сбер создал нейронную сеть ruDALL-E, которая способна создавать изображения на основе текстового описания, бери на вооружение, ведь данный проект в разы может ускорить твою работу.

Создание изображений происходит в три этапа: сначала одна нейросеть принимает текст на вход и генерирует заданное число картинок, затем следующая выбирает наиболее удачные из них и соответствующие описанию, а третья увеличивает их в размере без потери качества. Таким образом можно получить неограниченное количество новых изображений по указанным характеристикам.

Команды SberDevices и Sber AI при содействии SberCloud на основе публикации OpenAI воспроизвели код и запустили обучение нейросети на платформе ML Space на базе суперкомпьютера Кристофари.

В результате получилась самая большая модель такого рода в мире, работающая с русским языком. Обучение заняло 23 тысячи GPU-часов на массиве данных из 120 миллионов пар «текст-изображение». Проект по обучению ruDALL-E стал самым большим нейросетевым вычислительным проектом в России и СНГ.

Исполнительный вице-президент Сбербанка, CTO Сбера, руководитель блока «Технологии» Давид Рафаловский назвал этот проект «настоящим прорывом для русскоязычной индустрии», потому что еще 2 года назад даже постановку такой задачи было невозможно представить.

В целом за 2 две минуты вышла хорошая новогдняя открытка .

-2

Вот ссылка https://salute.onelink.me/wBEF/b83d97e5, использовать только с умом .