Найти тему

Теперь пять: нейросеть научилась рисовать пальцы

Оглавление

Новый алгоритм нейросети Midjourney научили рисовать правильные руки - теперь пальцев пять. Иногда, редко, бывает четыре. Но шестипалых пока не замечено. Что ещё изменилось в нейросети Midjourney в марте 2023 года.

Новый алгоритм

Новый алгоритм нейросети Midjourney вышел на релиз 16 марта 2023 года. Пока это альфа-тестирование, но по сути это уже "профессиональный" режим модели. Разработчики делают важное замечание:

Это альфа-тест, и все будет меняться. НЕ рассчитывайте на то, что именно эта модель будет доступна в будущем. Она будет значительно изменена по мере того, как мы будем доводить V5 до полного релиза.

Работа над версией V5 велась в течение 5 месяцев. И это вторая модель Midjourney, обученная на суперкластере ИИ. В ней используются существенно иные нейронные архитектуры и новые эстетические техники.

Эта модель может генерировать гораздо более реалистичные изображения, чем всё, что мы видели в Миджорни раньше.

Для перехода на этот алгоритм достаточно в конце промта написать --v 5, или выбрать в настройках (/settings).

Что нового в модели V5?

  • Гораздо более широкий стилистический диапазон и более чуткое реагирование на подсказки.
  • Более высокое качество изображения (увеличение разрешения в 2 раза) улучшенный динамический диапазон.
  • Изображения стали более детальные. Детали с большей вероятностью будут правильными.
  • Появляется меньше нежелательного текста.
  • Улучшена производительность при работе с подсказками изображений.

ВАЖНО

Сейчас в V5 нет апсемплера (увеличения) версии. Но при этом каждая из четырёх сгенерированных версий имеет разрешение по умолчанию такое же, как увеличенное изображение в V4 (для квадрата 1024 пикселя). То есть, если вы нажмёте на кнопку увеличения, это мгновенно даст вам одно изображение само по себе.

Есть ещё несколько обновлений, на которых я остановлюсь подробнее.

Пять пальцев

Версия V5 имеет много плюсов, и самый главный - приближенная к правильной анатомия рук. Все предыдущие версии рисовали лишние пальцы, часто они были ещё и кривыми, с лишними суставами. Именно за это многие критиковали Миджорни. Но с пятой версий поводов для критики стало в разы меньше. Да, пальцев иногда бывает меньше. Да, пальцы всё ещё не всегда выглядят здоровыми. Сохранилась проблема с правильным положением предметов в руках, особенно кисточек, карандашей и прочих инструментов. Но это уже огромный шаг вперёд.

Посмотрите на этих монахов - шесть рук и везде по пять пальцев.

Бесшовные текстуры

Версия --v 5 поддерживает параметр --tile для бесшовных текстур. Пока работает экспериментально, но результаты уже впечатляют. И вот это действительно отличное обновление. Создание бесшовных текстур - процесс не простой. Тем более создание замысловатых текстур. А Миджорни теперь делает их со скоростью 4 штуки в минуту размером 1024х1024 пикселя.

Разнообразие пропорций

Параметр --ar теперь поддерживает соотношение сторон более 2:1. Тоже экспериментально, и тоже качественно. Большой плюс в том, что каким бы ни было соотношение сторон, композиция сгенерируется законченной и гармоничной. Для примера на фото соотношение сторон 1:4. Хоть закладки для книг распечатывай.

Сопоставление подсказок

Этот параметр мне пока не до конца понятен, тем более что переводчики дают разные варианты перевода.

Поддерживается новый параметр --iw для взвешивания подсказок в виде изображений по сравнению с текстовыми подсказками. В другом варианте перевода используется слово "сопоставление". Предполагаю, что это аналог расставления быстрых весов, только с расставлением приоритетов на загруженное изображение или на текстовую часть промта. Раньше быстрые веса (::) для изображений не работали.

Стиль и подсказки для V5

Часто пользователи пишут в промтах объёмные литературные описания. И разработчики пошли им навстречу – вместо того, чтобы переучивать людей излагать свои мысли кратко и лаконично, научили алгоритм понимать такие промты. Вот что пишут сами разработчики:

Алгоритм V5 НАМНОГО более "беспристрастный", чем v3 и v4, и настроен так, чтобы обеспечить широкое разнообразие результатов и быть очень отзывчивым к вашим вводам. Компромисс заключается в том, что его может быть сложнее использовать.

То есть короткие подсказки могут работать не так хорошо. Для версии 5 надо написать более длинный, более четкий текст о том, что вы хотите получить. Пример от разработчиков: "кинематографическая фотография с драматическим освещением" (“cinematic photo with dramatic lighting”). То есть текст описания становится не набором словосочетаний, а предложением.

Правила сообщества

И последнее обновление Миджорни касается уже не алгоритма, а правил сообщества. Разработчики увеличили число модераторов в Дискорд-канале и улучшили инструменты модерирования. Это значит, что теперь отслеживание соблюдений правил сообщества будет более строгое и жёсткое. В случае нарушения можно получить полную блокировку.

Если было полезно - поставьте лайк и напишите "Спасибо" в комментариях. Это мотивирует меня на новые публикации! Подписывайтесь, чтобы не пропустить новые примеры работы нейросети.

Ещё на канале:

Источник фото: нейросеть Midjourney