522 подписчика

Графическая нейросеть Leonardo AI: разбираемся в настройках

23 июня 202323 июн 2023

944

7 мин

! Этот материал устарел. Обзор нового интерфейса находится здесь:

Как зарегистрироваться и работать в Leonardo AI в 2024: новый интерфейс Image Gen v2

***

Нейросетевая модель для генерации изображений Leonardo AI - штука настолько мощная, что для перечисления и краткого описания всех её возможностей не хватит не то что одной, но даже трёх-четырёх статей на Дзене. Пока что я прикидываю, что, возможно, смогу уложиться в шесть-семь, но это не точно.

К настоящему моменту мы успели разобраться с тем, как зарегистрировать бесплатный аккаунт на Leonardo и начать генерировать изображения, а также что такое платформенные модели Leonardo, где их найти и как ими пользоваться.

Leonardo понимает только английский язык, поэтому, если у вас с инглишем не очень, работать с нейросетью вам может быть не слишком комфортно. С другой стороны, если вам лень самостоятельно разбираться в настройках, заглядывая во все уголки и читая мелкий текст, то даже знание английского может не сильно помочь. Чтобы исправить это досадное неудобство, я стараюсь перевести всё что можно и объяснить, куда жать, максимально доступно.

Сегодня я расскажу о панели настроек, расположенной слева от основного окна, в котором генерируются изображения. Кое-что в ней вам должно быть уже знакомо: например, кнопки выбора количества создаваемых изображений или настройки размера картинок.

Вот они покрупнее. Разберёмся со всем по порядку, сверху вниз, слева направо. Разбираться будем по кускам, так удобнее. Кусок первый:

Number of Images (количество изображений): эта настройка определяет количество картинок, которые сгенерирует для вас нейросеть по одному запросу. Поскольку каждая картинка стоит от одного до четырёх токенов (зависит от выбранной модели и других настроек, но чаще два), эта опция позволит вам экономнее расходовать дневной бюджет.

Кнопки 5-8 неактивны, если у вас бесплатный аккаунт, поэтому максимальное количество вариаций по одному запросу - четыре.

Alchemy (алхимия): эта волшебная, по уверению разработчиков, алхимическая настройка позволяет заметно улучшить качество изображений и снизить количество ляпов, она прекрасно работает со всеми платформенными моделями, только вот незадача - доступна пока только при оплаченной подписке на ресурс. Поэтому нам не на что тут смотреть, проходим мимо.

Prompt Magic (магия запроса - по-русски звучит нелепо, но по-английски не так страшно): эта опция увеличивает точность соответствия картинки вашему описанию. Забавно, не так ли? То есть по умолчанию точность вам никто не гарантирует, а вот если вы включите Prompt Magic, тогда другое дело. Правда, за это придётся заплатить вдвое больше токенов, чем при выключенной опции, поскольку она "расходует больше вычислительной мощности".

У функции Prompt Magic есть две настройки, которые появляются, только если её активировать:

High Contrast (сильный контраст): делает тени глубже, а света ярче. Если результат получается слишком контрастным, просто отключите эту опцию.

Prompt Magic Strength (сила Prompt Magic): регулирует степень, или силу, применения функции Prompt Magic. Чем больше число, тем сильнее волшебство - то есть тем точнее картинка должна соответствовать вашему описанию.

Public Images (публичные изображения): эта опция включена по умолчанию для всех бесплатных аккаунтов. Она означает, что все сгенерированные по вашим запросам картинки автоматически валятся в общую ленту, где все могут видеть их, а также имя того, кто их заказал. Логика здесь проста: хотите генерировать безобразия для личного пользования и стесняетесь признаться в этом на публике? Извольте оплатить подписку, и будет вам приватность.

Переходим ко втором куску панели настроек:

Image Dimensions (размеры изображения): задаёт размеры будущего изображения. В предыдущей статье по теме об этом уже говорилось, но я повторю: разумнее всего при первичной генерации использовать те размеры, на которых тренировалась выбранная стилистическая модель - это даст наилучшие результаты, а размеры понравившегося варианта картинки можно будет изменить позже.

Если рядом с названием этой настройки вы видите жёлтый предупреждающий треугольник, значит, выбранные вами размеры не оптимальны. Обратите внимание на тренировочное разрешение модели (подробнее об этом - в той же статье) и измените размеры соответственно. Ну или не жалуйтесь на результат.

Внутри этой настройки вы можете выбирать размеры одним щелчком по кнопке с предустановленными параметрами, настраивать отдельно ширину (W) и высоту (H) или выбирать соотношение сторон из выпадающего списка - того, где на скриншоте указано 3:4.

Guidance Scale (шкала управления): эта настройка лично для меня окутана туманом. Разработчики сформулировали её функции так: "она позволяет вам установить, насколько будет взвешен ваш запрос", и порекомендовали использовать значение 7.

Как выглядит взвешивание запроса в контексте нейросетевой модели, я понимаю не очень хорошо. У меня есть смутная догадка, что эта функция в каком-то смысле дублирует Prompt Magic. Чтобы её проверить, я поступлю просто: прогоню один и тот же запрос с одной и той же моделью через три разных значения Guidance Scale: рекомендованное 7, минимальное 1 и максимальное 20.

Запрос: an exotic fruit, purple and yellow, with ridges, round, with a few raindrops, hanging on a branch with leaves, a garden in the background, soft warm light, realistic (экзотический фрукт, пурпурный и жёлтый, ребристый, круглый, с несколькими каплями дождя, висит на ветке с листьями, на фоне сада, мягкий тёплый свет, реалистично).

Начнём со значения 7:

Leonardo AI, DreamShaper v6, Guidance Scale =7

Теперь понизим значение Guidance Scale до 1:

Leonardo AI, DreamShaper v6, Guidance Scale =1

При минимальном значении настройки почти полностью пропали детали, заметно ухудшился реализм в построении самого плода, ветки и черенка, и наполз туман. Последний момент нужно запомнить: может, пригодится, если я захочу изобразить зловещий туманный пейзаж.

Теперь выкрутим настройку на максимум, до значения 20:

Leonardo AI, DreamShaper v6, Guidance Scale =20 (?)

А вот здесь меня ждал сюрприз. Несмотря на выставленную мной двадцатку, Leonardo заупрямился, проигнорировал мои желания и самовольно использовал значение 7. Вторая попытка сделать то же самое привела к таким же результатам, поэтому работает ли вообще эта шкала на значениях больше 7 - мне пока непонятно.

Единственная заметная разница состоит в том, что мои экзотические фрукты частично оказались понадкусаны, а частично мутировали в дикую помесь помидора, лимона и клубники.

Вернёмся к панели настроек.

ControlNet: эта настройка активируется в том случае, если для генерации картинки в качестве вводных данных вы используете не только текст, но и изображение. Эта тема достойна отдельной публикации, поэтому сейчас я пропущу описание СontrolNet, но обязательно вернусь к нему позже.

Tiling (плитка): эта очень полезная функция позволяет генерировать бесшовные текстуры и фоны. Изображения со сгенерированными текстурами можно укладывать рядами по горизонтали и вертикали, и места стыков не будут заметны.

Вот вам пример: текстура рыбьей чешуи (ну или то, что должно было выглядеть как рыбья чешуя, а получились какие-то крылья насекомых). Запрос: fish scale texture. Одиночное изображение, сгенерированное Leonardo:

А вот прямоугольник, замощённый этими изображениями: два по горизонтали и два по вертикали. Эта картинка была создана уже в Photoshop:

По-моему, получилось отлично. Правда, при составлении запроса на генерацию текстуры нужно хорошо подумать: срабатывает далеко не всё. Например, моя попытка сгенерировать бесшовный полигональный фон (запрос: polygonal background, low poly, red, orange, purple, blue) окончилась неудачей:

Здесь и без Фотошопа понятно, что право с левом и верх с низом бесшовно никак не сольются.

Наконец мы дошли до финальной части панели настроек, но о ней мне сказать особенно нечего. Отчасти потому, что здесь находится переключатель Image to Image / Image Prompt, то есть переключатель между двумя способами ввода: текстовым и "текст плюс изображение", а это, как уже было сказано, - тема для отдельной статьи.

Нижняя часть панели настроек Leonardo AI

Вторая причина, по которой мне тут нечего вам рассказать, заключается в расположении здесь настроек для продвинутых пользователей, которые к тому же оплачивают подписку.

Use fixed seed - это что-то про нюансы использования генератора случайных чисел в нейросетевой модели, а я, увы, в этой теме безнадёжно плаваю.

Scheduler доступен только для платных аккаунтов и определяет воздействие шума на генератор изображений. Не спрашивайте.

Нижняя кнопка - Reset to defaults - возвращает все настройки к исходным по умолчанию.

Вот и всё. Теперь вы знаете больше, чем пятнадцать минут назад, и я надеюсь, что вы сможете найти способ применить эти новые знания с пользой или хотя бы в удовольствие.

Только не думайте, что на этом рассказ об инструментах Leonardo закончен. Нет, хитрые разработчики разместили половину своих волшебных кнопочек не в панели настроек, а совсем в другом месте. О нём - в следующий раз.