Изучаем новый интерфейс и генерацию по тексту
Всего четыре месяца назад мы познакомились с одним из самых молодых ИИ-проектов Интернета: нейросетью KREA. Тогда это была только альфа-версия платформы с более чем спартанским дизайном и минимальным набором инструментов, и умела она делать немногое. По сравнению с другими аналогичными ресурсами KREA выглядела весьма невзрачно, хотя уже тогда подавала большие надежды. И они оправдались.
Не прошло и полугода, как разработчики проекта представили бета-версию — и это, скажу я вам, нечто!
Лучше один раз увидеть, поэтому сразу посмотрите, что теперь умеет KREA, а уж потом перейдём к разбору интерфейса. Для максимального вау-эффекта сначала кликните на картинку, а потом откройте её в отдельной вкладке, чтобы увидеть все детали.
Лично меня сильнее всего впечатлила проработка глаз, волос и текстуры кожи. Ну и то, что всё это мне выдали в размере 2048 x 2048 и совершенно бесплатно.
Новый интерфейс KREA
Итак, переходим на krea.ai. Для работы на платформе без ограничений необходима регистрация, при этом больше ничего не требуется: KREA полностью бесплатна. Если у вас есть аккаунт на Google, можно зайти под ним.
Бета-версия с порога заваливает предложениями, как парк аттракционов: пять больших карточек, предлагающих немедленно на них кликнуть и немедленно всё попробовать. Обязательно всё попробуем, но по порядку и не сразу. Сначала давайте разберёмся, где что.
- Режим генерации изображений.
- Режим увеличения и улучшения изображений.
- Создание оптических иллюзий: геометрических узоров из изображений.
- Ещё один вид оптических иллюзий, где вместо узоров используются логотипы.
Первые два пункта — основные мощные инструменты, предлагаемые платформой. Остальные — так, побаловаться. Пока что они не всегда срабатывают корректно и качество генераций там посредственное, но для развлечения вполне сгодится.
Оставлю их на попозже, а сегодня поговорим об основном: генерации картинок по описанию. Для перехода в этот режим проще всего кликнуть по первой большой карточке на главной странице, но и кнопка Generate в верхней части окна тоже подойдёт.
Первое, что вы увидите, может слегка сбить вас с толку:
По умолчанию KREA открывает окно генерации по картинке, Img2Img. Этот режим, как и всё здесь, отличается от аналогичных в остальных сервисах, но я вернусь к этому отличию чуть позже. А пока перейдём к генерации по тексту.
В верхней левой части окна располагается группа переключателей режимов (1): Text2Img (картинка по тексту), Img2Img (картинка по картинке), Screen2Img (картинка по содержимому вкладок ваших браузеров и открытых окон) и Camera (картинка по изображению, которое видит камера вашего устройства). Кликаем на верхний переключатель и переходим в окно генерации по тексту. Там нас встретит всё та же лягушка, но уже одна и по центру экрана. На моём скриншоте — заранее сгенерированная лошадь.
Справа вверху — небольшая группа доступных стилей (2): Cinematic (кинематографичный), Illustration (иллюстрация), Bloom (стиль, который засаживает всё цветами независимо от сюжета картинки) и Product (превращает любой сюжет в рекламный снимок для каталога, помещая объект по центру на однородном фоне). По умолчанию ни один из них не применяется (кнопка No style).
Чуть ниже располагается группа функциональных кнопок (3). Сверху вниз: быстро улучшить картинку; скачать; увеличить/улучшить в новом окне.
И, наконец, под изображением находится плавающая панель (4) с полем для ввода запроса и двумя кнопками: первая, с изображением игральных костей, выбирает из базы данных нейросети случайный запрос; вторая, с изображением ростка — выбирает случайное зерно. Нажимая на эту вторую кнопку, вы запускаете процесс генерации заново с другим параметром Seed (если вы не знаете, что это такое, у меня тут есть очень подробная статья про Seed и не только). Другими словами, это фактически кнопка "Сгенерировать заново".
Теперь, когда мы разобрались с кнопками, перейдём к процессу.
Генерация картинок по тексту
KREA не говорит по-русски, поэтому запросы для неё я буду писать на английском. Если это не ваш конёк, просто воспользуйтесь онлайн-переводчиком.
И вот тут пора рассказать про отличительную особенность KREA. Кнопки "Генерировать" здесь нет. Совсем. Процесс запускается автоматически, как только вы начинаете печатать, и происходит в режиме реального времени: буквально с каждым добавленным знаком картинка может изменяться. Если в процессе этих метаморфоз вы видите что-то, что вам нравится и полностью вас устраивает, переставайте печатать. Иначе убежит. Если вы закончили мысль, а результат вас ещё не удовлетворил, попробуйте поменять что-нибудь в тексте. Сначала, наверное, будет непривычно, потом приноровитесь.
Ввожу в текстовое поле A sack full of roasted coffee beans (мешок, полный обжаренных кофейных зёрен). Пока печатаю, вижу с десяток вариантов мешка, сменяющих друг друга, но в итоге получаю такую картинку:
На этом шаге KREA генерирует только эскиз, черновой вариант картинки. У вас есть возможность продолжить работу с ним, переписать запрос или нажать на кнопку выбора случайного зерна, чтобы попробовать создать что-то другое, но после этого вернуться к предыдущей версии вы уже не сможете.
В любом случае не пугайтесь, если картинка выглядит мутной и недоделанной: так и задумано. Впереди её ждёт дальнейшая обработка, а пока определитесь, нравится ли вам композиция и идея в целом. Если да, жмите на кнопку "быстрое улучшение" (верхняя в третьей группе кнопок). Пара секунд — и картинка становится заметно чётче:
Вы можете нажать на кнопку быстрого улучшения ещё несколько раз. Похоже на то, что каждое нажатие добавляет шаги (Steps) к процессу обработки, так что картинка становится всё более детализированной, увеличивается резкость. При этом слегка меняются детали, которые перерисовываются каждый раз заново на основе предыдущей версии.
Но после определённого числа нажатий быстрое улучшение достигает потолка возможностей (помните ту часть статьи, где рассказывается про Steps?). Для того чтобы сделать картинку ещё детальнее, нужно воспользоваться инструментом "Увеличение/улучшение". Жмём на третью кнопку в третьей группе, и в новой вкладке браузера открывается вот такое окно:
Сюда ведут таже кнопка Enhance в верхней части страницы и карточка номер два на главной странице сайта.
Слева в панели настроек на самом верху вы видите миниатюру вашей картинки. Вместо неё вы можете загрузить в принципе любое изображение, достаточно кликнуть по миниатюре. То есть этим инструментом можно пользоваться для обработки ваших фото, картинок, скачанных из Интернета, и вообще чего угодно.
Ниже расположены два ползунка: первый, AI Strength, регулирует степень детализации картинки; второй, Upscaling Factor — степень её увеличения.
Вы можете регулировать степень увеличения картинки ползунком либо ввести конкретные значения размеров в пикселах в поля под ним, но пока KREA работает только с квадратным форматом: ширина изображения равна высоте. Впрочем, если вы загрузите собственное прямоугольное изображение, обрезать его она не будет.
Ещё ниже расположено поле ввода текста: помните, что нейросети всегда требуют пояснения словами, что нужно изобразить. Если вы перешли в это окно из окна генерации, это поле будет автоматически заполнено, но текст можно редактировать.
Под полем для запроса расположено поле для отрицательного запроса (перечень того, что не должно появиться на картинке) и, наконец, кнопка Enhance (улучшить).
Выставляю настройки на максимальные (а как же ещё) и запускаю улучшатель.
И... поле остаётся серым. Ничего не происходит.
Нет, на самом деле, конечно, происходит: нейросеть анализирует изображение и текст, ставит заявку в очередь и, когда очередь подходит, начинает генерацию. Только в интерфейсе всё это не очень заметно: никакой яркой полоски или вращающихся кружочков по центру экрана. Но если вы посмотрите в левый нижний угол, то заметите маленький скромный квадратик, где отображается текущее состояние вашей заявки. На скриншоте окна он помечен цифрой 1.
Наконец результат готов. По умолчанию варианты "было" - "стало" загружаются один над другим, с ползунком, который можно передвигать для наглядного сравнения.
В нижней правой части окна (цифра 2 на скриншоте) можно выбрать другие варианты: отображать только улучшенную картинку или обе картинки рядом.
Готовое изображение можно скачать, нажав на маленькую кнопку в правой верхней части окна. Сравните кофе до и после обработки "улучшателем":
Напомню, что похожий инструмент пару месяцев назад представил Leonardo AI. Но только по подписке. Здесь же увеличение с нереальной детализацией доступно абсолютно бесплатно!
О недостатках
Разумеется, в бета-версии совершенство пока не достигнуто, и небольшие недостатки ещё есть. Вы скажете, что я придираюсь, но здесь даже искать не пришлось: некоторые вещи просо бросаются в глаза.
Во-первых, настолько хорошо понимать запросы, как, например, нынешний "Кандинский" или DALL-E, KREA пока не умеет. Какие-то детали в изображениях почти наверняка не будут совпадать с вашим описанием. Впрочем, понятливость у нейросетей — дело наживное: я не сомневаюсь, что этот параметр улучшится очень скоро.
Во-вторых, увеличивая детализацию картинки и добавляя триллион мелких штрихов, KREA часто увлекается и иногда делает слишком прорисованными даже те участки, где это совсем не требуется. В процессе могут появляться ненужные артефакты. Например, на предыдущей картинке рогожка, на которой стоит мешок, превратилась в полотно из спрессованных микрозёрен кофе. А указательный палец левой руки девушки на примере ниже после "улучшения" отделился от кисти и стал выглядеть слегка изуродованным:
В-третьих, при улучшении картинка может принципиально меняться в деталях (что неудивительно, поскольку она просто перерисовывается заново). Заодно искажаются исходные цвета. Часто это некритично, но, если вы загрузили своё фото для обработки, могут быть сюрпризы.
В довесок иногда вокруг картинки KREA зачем-то рисует чёрную рамочку. Эту проблему решить легче всего, но хотелось бы всё же узнать — зачем?..
Важная деталь
Если вам нужно просто увеличить изображение хорошего качества, не стоит увлекаться параметром AI Strength. Как бы вам ни хотелось выкрутить всё на максимум, учитывайте характер исходной картинки. Алгоритмы "улучшателя" настроены на увеличение резкости в деталях, поэтому они ищут мелкие различия в оттенках цвета на изображении и усиливают контраст на границе этих различий. В случае если картинка и без того чёткая, это может полностью её испортить. На примере ниже иллюстрация, сгенерированная нейросетью Dream в стиле цифровой живописи, стала выглядеть хуже после обработки со значением AI Strength 0.85. Это та самая ситуация, когда "лучшее" — враг хорошего. Если вам требуется просто увеличить картинку, которая уже обладает достаточной резкостью, возможно, вообще не стоит применять параметр AI Strength.
Бонус: исправляем недостатки (если дружим с Photoshop)
От вышеперечисленных мелких недостатков легко избавиться, если у вас есть навыки работы в графических редакторах. Скачайте два варианта картинки: до и после прогона через Enhance. Поместите их в один файл Photoshop слоями один над другим: при одинаковых размерах объекты на них должны полностью совпасть. Допустим, вы поместили улучшенную детальную версию над исходной. Теперь добавьте маску к верхнему слою и мягкой чёрной кистью закрасьте те участки, которые получились излишне "улучшенными", чтобы проявить изображение с нижнего слоя.
Вот мой пример:
Мне хотелось детальнее проработать шерсть и нос, и с этим нейросеть справилась отлично. Но цвета поблекли, глаза стали слишком светлыми, а фоновые мутные кружочки (допустим, падающий снег) превратились в чёткие звёздочки, слишком сильно отвлекающие внимание. Поэтому я замаскирую задний план и немного пройдусь кистью по светлым участкам на глазах, чтобы сделать их темнее, а также по бокам и ушам оленёнка, чтобы уменьшить глубину резкости. Теперь можно вернуть чёткость отдельным звёздочкам, чтобы вынести их на передний план — это тоже поможет создать ощущение глубины. Наконец, я продублирую слой с более насыщенными цветами, помещу его над остальными и изменю режим наложения на "Цвет". Исходные изображения и результат:
Надеюсь всё же, что с дальнейшим развитием модели необходимость проводить такую доработку напильником отпадёт сама собой.
Ну, как вам новая KREA? Впечатляет, правда? И это только начало истории. Продолжим разбираться в её возможностях в одной из следующих публикаций.