Найти тему
РБК Тренды

Сюрреализм и режим фэнтези: как создать свою картинку с помощью нейросети

Оглавление

Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые приложения бесплатны и доступны всем желающим

  Unsplash
Unsplash

Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. РБК Тренды подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).

Содержание:

  • DALL-E Mini
  • ruDALL-E Kandinsky
  • Midjourney
  • Starryai
  • Dream by WOMBO

DALL-E Mini

Как попробовать:

  • зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
  • найти раздел dall-e;
  • ввести текстовое описание на английском языке, разделяя слова пробелами;
  • нажать Run;
  • когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.

Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.

ruDALL-E Kandinsky

Как попробовать ruDALL-E Kandinsky:

  • зайти на официальный сайт нейросети;
  • выбрать «Попробовать»;
  • ввести текстовое описание в окне через пробелы на русском языке;
  • ввести код подтверждения;
  • скачать готовую картинку или поделиться ею в соцсетях через специальную кнопку.

Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).

   Картинка по описанию ruDALL-E Kandinsky
Картинка по описанию ruDALL-E Kandinsky

Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе уже есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.

В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. Она доступна в приложении «Салют» от SberDevices и в боте Discord. По словам разработчиков, генерация изображений учитывает точное описание желаемого и создает уникальные изображения, которые раньше не существовали. Их можно использовать для иллюстраций статей, а также в копирайтинге и рекламе.

Midjourney

Как попробовать:

  • зарегистрироваться на платформе для геймеров Discord;
  • зайти на официальный сайт Midjourney и авторизоваться через Discord;
  • перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
  • ввести описание на английском языке в плашке Prompt;
  • кликнуть «Отправить»;
  • появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
  • нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.

Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. В бесплатной версии можно сгенерировать 25 сетов в низком разрешении или меньше, так как попытки улучшить изображения засчитываются как новая попытка генерации. По сравнению с конкурентами Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом.

Starryai

Как попробовать:

  • перейти на сайт Starryai, кликнуть «Start Creating»;
  • пройти верификацию через Google или Apple;
  • выбрать опцию Altair или Orion;
  • в окне Prompt ввести текстовое описание на английском языке;
  • в окне появится картинка, которая будет преобразовываться прямо на глазах;
  • кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.

Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.

Dream by WOMBO

Как попробовать:

  • зайти на сайт Dream;
  • в окне Prompt вбить текстовое описание на английском языке;
  • выбрать стиль картинки и кликнуть Create;
  • нажать Save, также можно повторить попытку генерации, нажав Generate Again.

Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.

В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.

   Картинка, сгенерированная Imagen / Google AI
Картинка, сгенерированная Imagen / Google AI

Сначала Google открыла свой сервис для ограниченного бета-тестирования, но теперь оно, похоже, закрыто. Видимо, в ближайшем будущем Imagen станет общедоступным.