Найти в Дзене

Как создавать картинки с нейросетью Dream: подробное руководство. Часть 2

О смешных ограничениях бесплатной версии Эта публикация — продолжение рассказа о нейросети Dream, а конкретнее — об одноимённом мобильном приложении для создания картинок. Ссылка на первую часть расположена в конце статьи. Чтобы лучше понимать, о чём идёт речь, советую сначала прогуляться по ней, а затем вернуться сюда. После первого знакомства с интерфейсом мобильного приложения Dream перейдём к самому интересному, то есть к генерации изображений. Об одной вещи нужно сказать заранее: Dream в текущей версии 3.2.0 не без багов, и иногда они очень сильно огорчают. О тех, что мне попадались, я расскажу в конце этой статьи. Предупреждён — значит вооружён. Будем надеяться, что в одном из следующих обновлений разработчики от них избавятся. Генерация картинок по тексту В Dream вы можете вводить текст запроса на русском языке, и есть хорошие шансы, что приложение при помощи собственного переводчика поймёт вас правильно. Но после того как на запрос "весёлый булочник" нейросеть нарисовала мне тр
Оглавление

О смешных ограничениях бесплатной версии

Павлиньи перья — лучшие друзья девушек. Dream 3.2.0
Павлиньи перья — лучшие друзья девушек. Dream 3.2.0

Эта публикация — продолжение рассказа о нейросети Dream, а конкретнее — об одноимённом мобильном приложении для создания картинок. Ссылка на первую часть расположена в конце статьи. Чтобы лучше понимать, о чём идёт речь, советую сначала прогуляться по ней, а затем вернуться сюда.

После первого знакомства с интерфейсом мобильного приложения Dream перейдём к самому интересному, то есть к генерации изображений.

Об одной вещи нужно сказать заранее: Dream в текущей версии 3.2.0 не без багов, и иногда они очень сильно огорчают. О тех, что мне попадались, я расскажу в конце этой статьи. Предупреждён — значит вооружён. Будем надеяться, что в одном из следующих обновлений разработчики от них избавятся.

Генерация картинок по тексту

В Dream вы можете вводить текст запроса на русском языке, и есть хорошие шансы, что приложение при помощи собственного переводчика поймёт вас правильно. Но после того как на запрос "весёлый булочник" нейросеть нарисовала мне трёх подряд умильных кроликов без единой булки, моим предпочитаемым языком остался всё-таки английский. Если вы окажетесь в подобной ситуации и не говорите по-английски, используйте онлайн-переводчики Яндекса, Гугла или сервис DeepL. Они ребята толковые и гарантированно не перепутают кроликов с булочниками.

После того как вы ввели запрос (или подсказку, как это называется в переводе) и нажали кнопку "Создать", открывается окно генерации. Сначала вы полюбуетесь на разноцветную волну, бегущую по экрану, а потом появится превью картинки.

Окно генерации изображения в приложении Dream.
Окно генерации изображения в приложении Dream.

Под ним в блоке 1 располагается много амбарных замков, которые открываются только оплаченной подпиской. Это места для вариаций изображения. Бесплатно можно сгенерировать только одну картинку за раз, с подпиской сразу 4. В этом случае на месте замков появятся маленькие превью трёх остальных вариаций, и их можно будет перебирать по очереди.

Чуть ниже находится переключатель (2), который меняет взаимное расположение превьюшек: они могут выглядеть так, как на скриншоте, или располагаться плиткой в два ряда по две картинки. Поскольку на бесплатных аккаунтах создаётся только одна картинка за раз, плиточный вариант расположения превью будет выглядеть совсем неинтересно, и для нас этот переключатель бесполезен.

Зато очень полезен переключатель Undo/Redo (3), но не сам по себе, а в сочетании с кнопкой "Регенерировать" (4).

"Регенерировать" в оригинале Regenerate в данном случае означает не "отрастить себе новый хвост", а "сгенерировать заново". Благодаря этой кнопке даже на бесплатном аккаунте можно получать не то что четыре, а бесконечное число вариантов изображения, если жать на неё снова и снова. А если в какой-то момент вы поймёте, что самая лучшая картинка осталась позади, просто вернитесь назад, нажав на кнопку Undo.

Все варианты картинки сохраняются в памяти приложения до тех пор, пока вы не выйдете из окна генерации.

Кнопка Redo, соответственно, проматывает весь набор текущих генераций вперёд.

Более того, все эти бесконечные варианты изображения вы можете скачивать на своё устройство.

Каждая сгенерированная картинка вообще-то и не превью вовсе, а уже полноразмерное готовое изображение. Вы можете сохранить её по ходу дела, не завершая процесса генерации и не выходя из текущего окна.

Для этого коснитесь кнопки в нижнем левом углу картинки:

Окно генерации изображения в приложении Dream.
Окно генерации изображения в приложении Dream.

Нажимаете на "Скачать изображение", и картинка сохраняется в вашей галерее в автоматически созданной папке.

В случае с моим запросом A beautiful girl in a peacock feathers crown (красивая девушка в короне из павлиньих перьев) мне понравился первый же результат, но интересно было посмотреть и другие варианты. На скриншоте ниже вторая картинка. Она оказалась тоже неплохой, но "финализировать" (сохранять в галерее Dream) я буду всё-таки первую, а вторую просто скачаю. Обратите внимание, что кнопка Undo стала активной значит, я могу вернуться к предыдущей версии.

Окно генерации изображения в приложении Dream.
Окно генерации изображения в приложении Dream.

После сохранения картинки на устройстве Dream предлагает вам кого-то уволить. Это всего-навсего кнопка Dismiss (закрыть) для быстрого закрытия уведомления. Но даже если её не нажимать, оно закроется само.

Здесь остались необъяснёнными две кнопки. "Создание вариантов" (5) — опция, которую невозможно оплатить кредитами приложения, поэтому проверить её работу я не могу. Думаю, что она не сильно отличается от аналогичных функций других нейросетей и должна генерировать картинки, похожие на основную, но с небольшими изменениями.

Кнопка, на которой на моём скриншоте не помещается текст (6), + это, по иронии, "Кнопка "Редактировать с помощью текста". Об этой функции приложения я расскажу подробнее в следующей части руководства.

Переходим к публикации выбранной картинки. Жмём на слово "Финализировать" в верхнем правом углу и переходим на следующий экран.

Последнее окно перед завершением генерации.
Последнее окно перед завершением генерации.

Здесь машинный переводчик оторвался по полной. Поехали сверху вниз.

"Купить печать": эта кнопка перенаправит вас на сайт Wombo, разработчика приложения, где всего за $45 вам предложат распечатать ваш шедевр на холсте. И вовсе это не дорого: это канадские доллары.

"Просмотр видео поколения" звучит исторически масштабно, но означает не показ документальных хроник, а всего лишь "Посмотреть видео генерации" (watch generation video). Правда, все такие видео на одно лицо, в чём можно убедиться, посмотрев короткую компиляцию, и ещё я очень сомневаюсь, что именно так выглядит процесс генерации.

Далее следует пара вменяемых надписей: "Добавить заголовок" на случай, если вы хотите дать вашему шедевру название, которое будет отображаться в общей галерее, и "Текстовая подсказка", то есть использованный вами запрос. Вы можете отключить его показ, чтобы другие пользователи не могли его видеть.

"Разрешено на корм" — моё любимое. Это Allowed on feed, "разрешено в ленте". Если отключить это разрешение, то картинка будет показываться только в вашей персональной галерее и не попадёт в общую.

Второе место среди моих переводных фаворитов занимает кнопка "Отделка". На самом деле это просто Finish, "завершить". Нажатие на неё завершает весь процесс и отправляет картинку в галерею.

Но даже на этом этапе вы всё ещё можете полностью отказаться от публикации изображения, но при этом скачать себе и полноформатную картинку, и видео "процесса генерации". Для этого нажмите кнопку с иконкой скачивания в правом верхнем углу. Всплывёт вот такое меню:

-6

Скачать видео можно будет и позже из вашего аккаунта. Здесь всё должно быть знакомо: значок в виде трёх точек над картинкой открывает аналогичное меню, к которому добавлена кнопка "Удалить".

Меню, которое открывается на странице публикации в вашем аккаунте.
Меню, которое открывается на странице публикации в вашем аккаунте.

О багах в версии 3.2.0

В отзывах на Play Store многие ругают разработчиков за баги, а они виновато оправдываются. Возможно, к моменту, когда вы будете читать этот текст, всё уже будет починено. Но пока что в приложении регулярно возникают одни и те же три ошибки:

1. При генерации приложение перепрыгивает через картинку. Выглядит это так: на долю секунды вам показывают первый вариант изображения, потом он сразу сменяется вторым. Если попытаться вернуться назад через кнопку Undo, вы увидите на месте превью только чёрное поле и стрелочку с подписью Retry (попробовать ещё раз). Retry не получится, первая картинка пропала навсегда.

В бесплатном режиме это не страшно, хотя и может быть досадно. Но в платном у вас вычитают по монете за каждую картинку, в том числе и за потерянные. Таким манером ваш бюджет может быстро закончиться, а результата вы не увидите.

2. Если вы уже начали генерировать картинку, но потом решили прервать процесс, вернуться назад и изменить запрос, приложение может не отреагировать на изменения сразу и продолжать создавать изображения по старому запросу. Через пару регенераций до него обычно доходит.

Опять же, это не так страшно, если генерация бесплатная. Но если вы тратите монетки, будет обидно получить не тот результат, которого вы хотели.

3. Этот баг самый безобидный. Иногда при генерации вместо превью вы видите просто чёрное поле (без стрелочки Retry, что важно). В этом случае знайте, что на самом деле изображение существует, просто не загружается. Чтобы его увидеть, можно попробовать сгенерировать ещё пару вариантов, а потом вернуться назад при помощи кнопки Undo.

На сегодня всё. Самые основные вещи про Dream рассказаны, впереди альтернативные способы ввода и кое-что про стили. А вот ссылки на предыдущие посты по теме:

Как создавать картинки с нейросетью Dream: подробное руководство. Часть 1

Нейросеть Dream: особенности российской локализации