Найти в Дзене

Увеличение картинок нейросетями: KREA vs Fooocus vs Pixelcut

Оглавление
Феи бывают разные: к одним прилетают зелёные, к другим — красные...
Феи бывают разные: к одним прилетают зелёные, к другим — красные...

Около месяца назад в моём блоге уже выходила статья со сравнением инструментов "умного" увеличения изображений нейросетей KREA и Leonardo AI. Вскоре после этого увеличитель Universal Upscaler от Leonardo взял да и исчез. Точнее, спрятался: если перейти по прямой ссылке, ведущей на него, то на долю секунды страница загрузится, но сразу же перенаправит вас на главную сайта. Это печально, но не навсегда: если страницу не удалили совсем, значит, собираются её вернуть. Сейчас разработчики готовят целый ворох обновлений, и, будем надеяться, в ближайшем будущем мы сможем пользоваться Universal Upscaler снова. А пока они там решают свои технические вопросы, нам нужно пользоваться чем-то взамен спрятанного увеличителя. И альтернатива есть!

Но прежде чем я к ней перейду, будет уместно в ...-дцатый раз напомнить, что всё течёт, всё меняется в мире вообще, а в мире нейросетей — особенно быстро. Поэтому не удивляйтесь, если что-то, описанное в моих публикациях, на следующий день начинает работать иначе или вообще пропадает. Я не имею ни контактов с разработчиками, ни влияния на них, а они трудятся не покладая рук денно и нощно, постоянно что-то добавляя и удаляя. Так что обращайте внимание на дату выхода статей и, если прошло уже достаточно времени, проверяйте блог на наличие более свежих материалов по той же теме.

Как пользоваться увеличителями картинок

Увеличивать картинки с помощью нейросетей можно на разных платформах, но здесь я буду сравнивать только три инструмента: Upscale & Enhance от KREA, Upscale or Variation от Fooocus и Image Upscaler от Pixelcut. Начну с короткого рассказа о том, как пользоваться каждым из них.

KREA — Upscale & Enhance

Если вы читаете мой блог регулярно, с инструментом Upscale & Enhance от KREA вы уже должны быть хорошо знакомы. При необходимости можно освежить свою память, полистав публикации в тематическом разделе. Тем не менее, поскольку его интерфейс со времени выхода статей изменился, я напомню, как им пользоваться.

Для начала вам нужно авторизоваться в KREA (проще всего это сделать с аккаунтом Google, если вы его имеете). Затем с главной страницы вы переходите в раздел Upscale & Enhance:

-2

Сейчас интерфейс инструмента выглядит вот так:

-3

Слева расположена галерея всех ваших предыдущих увеличенных изображений. В любой момент можно вернуться к каждому из них и заново увеличить с новыми настройками или скачать. После того как вы выберете одну из картинок в галерее или загрузите новую, появится панель инструментов справа:

-4

Под миниатюрой выбранной картинки находится панель настроек. На самом верху — переключатель размеров: 1х для перерисовки картинки без её увеличения, 2х для увеличения в четыре раза (вдвое по горизонтали и по вертикали), 4х и 8х — для увеличения в 16 и 64 раза соответственно. Для бесплатных аккаунтов доступно только увеличение 2х. Если хотите открыть другие настройки и подвигать ползунки, щёлкните на переключателе Settings. Когда будете готовы, нажимаете кнопку Enhance и немного ждёте. Вуаля:

-5

Кнопка для скачивания результата расположена внизу справа.

Из-за высокой популярности инструмента (ну и чтобы вернуть инвестиции) разработчики недавно ввели ограничительную систему: в день вы можете потратить только определённое количество условных минут. Минуты в KREA — это такая внутренняя валюта, вроде монет или токенов. Максимальное количество минут выдаётся при оформлении подписки, а пользователи с бесплатными аккаунтами получают их, разумеется, меньше всех, но баланс обновляется ежедневно. Каждая операция на платформе стоит определённое количество минут, причём увеличение довольно дорого, так что используйте свои минуты бережливо.

Fooocus — Upscale or Variation

Про аналогичный инструмент от нейросети Fooocus в этом блоге пока упоминалось только вскользь. В основном нас интересовало, как до этой нейросети добраться и её запустить, поскольку в "Фокусе" это главная сложность. После того как он заработает, сделать всё остальное уже очень просто. Как добраться и запустить, подробно описано вот в этой статье. Это довольно длинная история, так что, с вашего позволения, повторять всё это здесь я не буду. А о том, как работать в этой нейросети с изображениями, можно почитать в статье про ControlNet.

Итак, вы запустили Fooocus и перед вами — его минималистичный интерфейс. Поставьте галочку напротив пункта Input Image под полем для ввода текста, чтобы открыть панель ControlNet для работы с изображениями. В наборе вкладок этой панели на первом месте находится вкладка Upscale or Variation (увеличение или вариация). Она-то нам и нужна:

Здесь же есть и возможность сгенерировать вариации картинки, но без её увеличения.
Здесь же есть и возможность сгенерировать вариации картинки, но без её увеличения.

Просто загружаете туда картинку, справа выбираете один из трёх вариантов увеличения (Upscale): 1,5х, 2х или быстрый 2х (Fast 2x) и жмёте на кнопку Generate. На выходе не обязательно должно получиться только одно изображение: их количество задаётся в настройках так же, как при обычной генерации. Все варианты будут различаться незначительно, но различия тем не менее будут, так что вы сможете выбрать тот результат, который вам больше нравится. Стилями при увеличении картинки управлять нельзя (во всяком случае, у меня не вышло).

Pixelcut — Image Upscaler

Самый простой и прямолинейный увеличитель изо всех, о которых я сегодня рассказываю. Pixelcut — это онлайн-набор разнообразных инструментов на основе ИИ для обработки изображений. Здесь есть, например, инструменты удаления фона, нежелательных объектов на фотографии, перекрашивания и интересующий нас инструмент увеличения. Переходите по ссылке, загружаете картинку, и она автоматически моментально увеличивается, даже никаких кнопок нажимать не надо. После этого результат можно скачать.

Простой как картошка интерфейс увеличителя от Pixelcut
Простой как картошка интерфейс увеличителя от Pixelcut

Бесплатно сервис увеличивает картинки тоже в два раза по ширине и высоте, итого — в четыре. С платной подпиской на Pixelcut максимально можно увеличить картинку в 4х4 — 16 раз.

Сравниваем результаты увеличения

Теперь переходим к полевым испытаниям. Для опытов я возьму картинки, созданные в разное время с помощью разных нейросетей. В каждой галерее на первом месте расположен оригинал, а за ним следуют увеличенные варианты: от Pixelcut, Fooocus и KREA соответственно.

Поехали.

Первая картинка — мухоморная фея, сгенерированная на платформе Playgroundai. Легко заметить, что увеличенный вариант от Pixelcut не изменил практически ничего, даже не потрудился исправить невнятные пальцы, но изображение в целом выглядит более резким. Fooocus заметно изменил лицо и попытался сделать что-то с пальцами на руках и ногах, уложил волосы по-другому, а также добавил деталей в венок и платье и изменил прожилки на крыльях. Но сильнее всех разошлась KREA: картинка полностью переосмыслена, и героиня уже не похожа на невинное дитя, как в оригинале. Кроме того, KREA единственная детально перерисовала и мухомор на заднем плане, на который все остальные просто не обратили внимания. (Здесь и далее для увеличения в KREA я использую стиль по умолчанию (Default).)

Ещё одна фея, на этот раз — от Leonardo AI. Снова Pixelcut принципиально не меняет ничего, просто добавляет резкости; Fooocus перерисовывает детали, но в целом старается не сильно отклоняться от оригинала, а KREA отрывается по полной, добавляя множество деталей даже на заднем плане.

Следующий образец — от "Шедеврума". Снова наблюдаем ту же картину: простое увеличение от Pixelcut, аккуратная коррекция деталей от Fooocus и полное переосмысление от KREA.

Этот пример от "Кандинского" отличается от прочих тем, что деталей тут изначально достаточно, а кое-где даже больше, чем надо. Эта нейросеть рисует картинки с характерным шумом — мелкозернистой контрастной текстурой где нужно и не нужно. Pixelcut решил, что это дефект (в общем, так и есть), и шум со своей версии удалил. Fooocus подправил лицо в соответствии со своими представлениями о прекрасном, но попутно потерял детали в наряде, а KREA взяла и добавила бедной инопланетянке лет десять возраста и суровых жизненных испытаний. Зато снова детально проработано всё, включая фон.

Последний пример был создан на платформе getimg. Комментировать уже и ни к чему, и так всё понятно. Сюжет здесь простой, мелких деталей мало, поэтому KREA сосредоточилась на проработке волос, костюма и звёздного неба. Надо сказать, что в этом случае её подход оказался наиболее выигрышным: никаких искажений объекта, одно улучшение.

Какой увеличитель использовать?

Ответ должен быть уже очевиден. Если важно сохранить изображение максимально близким к исходному (например, увеличить семейное фото), Pixelcut — ваш вариант. Если хочется покреативить, вам к KREA. Где-то посередине находится сбалансированный Fooocus. Но помимо объёма вносимых в картинки изменений, есть и другие немаловажные факторы, которые могут повлиять на ваш выбор:

  • Pixelcut очень прост в использовании и не имеет ограничений по количеству обрабатываемых изображений. До него легко добраться, и он не требует регистрации. Хотя он основан на ИИ и перерисовывает картинку заново (а не просто добавляет пиксели к существующей, как делали старые версии Photoshop, например), такого параметра, как "креативность", там просто нет, так что изменить детали вы не сможете даже при желании.
  • Fooocus тоже формально не имеет ограничений по количеству изображений; более того, за один заход можно генерировать несколько вариантов. Но, чтобы запустить эту модель, надо немного потрудиться, к тому же в любой момент вас могут отключить от гугловского GPU из-за наплыва желающих, а без него модель работать не будет. Конечно, если вы можете позволить себе скачать Fooocus для использования на собственном компьютере, это совсем другое дело. Я вам завидую. Регистрация для самой нейросети не нужна, но для работы в Google Colab требуется гугл-аккаунт.
  • KREA ограничивает вас ежедневным лимитом минут, зато здесь вы можете гибко настраивать все параметры генерации, включая степень изменения оригинала. Добраться до KREA легко, но для работы придётся зарегистрироваться. Впрочем, гугл-аккаунт выручит и здесь.

Как видим, даже этих трёх инструментов может оказаться достаточно для любой ситуации, в которой может понадобиться качественное увеличение картинки. Если вы знаете другие увеличители с интересными особенностями, делитесь ссылками и описаниями в комментариях. Пригодится всем.