35,4 тыс подписчиков

Сюрреализм и режим фэнтези: как создать свою картинку с помощью нейросети

31 августа 202231 авг 2022

369

5 мин

Оглавление

DALL-E Mini
ruDALL-E Kandinsky
Midjourney

Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые приложения бесплатны и доступны всем желающим

Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. РБК Тренды подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).

Содержание:

DALL-E Mini
ruDALL-E Kandinsky
Midjourney
Starryai
Dream by WOMBO

DALL-E Mini

Как попробовать:

зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
найти раздел dall-e;
ввести текстовое описание на английском языке, разделяя слова пробелами;
нажать Run;
когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.

Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.

ruDALL-E Kandinsky

Как попробовать ruDALL-E Kandinsky:

зайти на официальный сайт нейросети;
выбрать «Попробовать»;
ввести текстовое описание в окне через пробелы на русском языке;
ввести код подтверждения;
скачать готовую картинку или поделиться ею в соцсетях через специальную кнопку.

Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).

Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе уже есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.

В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. Она доступна в приложении «Салют» от SberDevices и в боте Discord. По словам разработчиков, генерация изображений учитывает точное описание желаемого и создает уникальные изображения, которые раньше не существовали. Их можно использовать для иллюстраций статей, а также в копирайтинге и рекламе.

Midjourney

Как попробовать:

зарегистрироваться на платформе для геймеров Discord;
зайти на официальный сайт Midjourney и авторизоваться через Discord;
перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
ввести описание на английском языке в плашке Prompt;
кликнуть «Отправить»;
появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.

Картинка улучшенного качества из коллажа Midjourney

Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. В бесплатной версии можно сгенерировать 25 сетов в низком разрешении или меньше, так как попытки улучшить изображения засчитываются как новая попытка генерации. По сравнению с конкурентами Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом.

Starryai

Как попробовать:

перейти на сайт Starryai, кликнуть «Start Creating»;
пройти верификацию через Google или Apple;
выбрать опцию Altair или Orion;
в окне Prompt ввести текстовое описание на английском языке;
в окне появится картинка, которая будет преобразовываться прямо на глазах;
кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.

Картинка, сгенерированная в Altair с эффектом Concept Art

Картинка, сгенерированная в Orion с применением трех эффектов

Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.

Dream by WOMBO

Как попробовать:

зайти на сайт Dream;
в окне Prompt вбить текстовое описание на английском языке;
выбрать стиль картинки и кликнуть Create;
нажать Save, также можно повторить попытку генерации, нажав Generate Again.

Картинка, которую сгенерировал сервис Dream с первой попытки

Картинка, которую сгенерировал сервис Dream со второй попытки

Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.

В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.

Картинка, сгенерированная Imagen / Google AI

Сначала Google открыла свой сервис для ограниченного бета-тестирования, но теперь оно, похоже, закрыто. Видимо, в ближайшем будущем Imagen станет общедоступным.