850 подписчиков

Зачем нужна кнопка artGPT в нейросети FusionBrain (Kandinsky). Показываю ее применение.

29 прочтений

30 июня

Те кто пользовался нейросетью Кандинский, наверняка видели эту кнопку в уголке. Если вы уже знаете для чего она нужна, то вы ничего нового не узнаете. Статья для тех, кто либо не видел эту кнопку, либо видел, но так и не понял как она работает.

Не буду долго томить, эта кнопка, это еще одна нейросеть - artGPT. И служит она для дополнения деталями вашего промта. Для тех кто не знает, промт - это тот текст, который вы вводите в поле, и на основе которого нейросеть генерирует изображение. При включенной кнопке artGPT, нейросеть незаметно добавляет к вашему описанию дополнительные детали, пытаясь сделать изображение более лучшим. К сожалению, вы не сможете посмотреть, что именно он добавил к вашему промту. Вы увидите уже лишь результат на картинке.

Итак, значит ли это, что когда мы генерируем изображение, всегда стоит включать и artGPT? Однозначного ответа нет. Так как изменения, которые он вносит, мы не контролируем. Все на самом деле зависит от вашего промта. Если у вас есть в голове конкретный результат, который вы хотите получить, и написали очень подробный промт (в том числе и негативный), то скорее всего artGPT вам не поможет. Так как внесет много своих изменений.

Но вот если у вас вообще в промте ничего нет, кроме пары слов, или же у вас нет точного представления о результате, который хотите получить, а есть лишь только смутные представления, то рекомендую пользоваться этой кнопкой.

Примеры генерации с кнопкой и без

Итак, надеюсь суть вы уловили. Перейдем теперь к примерам. Посмотрим как один и тот же промт будет выглядеть с включенной и выключенной кнопкой.

Итак, введем очень простой запрос "маленький котенок", в свободном стиле. Вот так он выглядит без кнопки.

А теперь давайте включим кнопку.

Итак, без кнопки мы получаем статичное красивое изображение. С включенной кнопкой картинка немного изменилась. На первый взгляд может показаться, что нет особой разницы между картинками. Но это ошибочное мнение. Появилось движение и пространство. На первом изображение все статично. Котик сидит, фон замылен ( и вообще фон очень стандартный). А на втором изображении появилось движение, котенок входит в помещение. Помещение уже не просто размытый фон, а вполне четкой, много дополнительных деталей.

Давайте попробуем еще один пример. Выберем запрос "городская площадь, фотография".

Итак пробуем сначала без кнопки.

А теперь подрубаем на помощь нашу нейросетевую кнопку.

Галерея. Два изображения. Оба с помощью artGPT

Тут разница уже куда заметнее. Без кнопки, нейронка выдает неплохой результат, но немного неестественный. Мрачные тона, здания слишком разные по стилю. Такое конечно бывает, но слишком уж выделяется.

А вот во второй генерации, artGPT справился я думаю гораздо лучше. Ведь скорее всего задавая такой промт, мы скорее всего хотели получить подобный результат. Он более подходит запросу. Здания уже все в одном стиле, много людей. Все по разному одеты, много деталей, например пакеты, рюкзаки.

Так что на мой взгляд, для простых запросов, без подробного промта, artGPT, отличный помощник. Который позволит вам не слишком заморачиваться с деталями. В любом случае можете смело пробовать создавать изображения сразу с включенной кнопкой, и уже если генерируемые изображения слишком далеко уходят от вашего представления, то тогда уже ее выключайте.

Спасибо за внимание.