Новый алгоритм нейросети Midjourney научили рисовать правильные руки - теперь пальцев пять. Иногда, редко, бывает четыре. Но шестипалых пока не замечено. Что ещё изменилось в нейросети Midjourney в марте 2023 года.
Новый алгоритм
Новый алгоритм нейросети Midjourney вышел на релиз 16 марта 2023 года. Пока это альфа-тестирование, но по сути это уже "профессиональный" режим модели. Разработчики делают важное замечание:
Это альфа-тест, и все будет меняться. НЕ рассчитывайте на то, что именно эта модель будет доступна в будущем. Она будет значительно изменена по мере того, как мы будем доводить V5 до полного релиза.
Работа над версией V5 велась в течение 5 месяцев. И это вторая модель Midjourney, обученная на суперкластере ИИ. В ней используются существенно иные нейронные архитектуры и новые эстетические техники.
Эта модель может генерировать гораздо более реалистичные изображения, чем всё, что мы видели в Миджорни раньше.
Для перехода на этот алгоритм достаточно в конце промта написать --v 5, или выбрать в настройках (/settings).
Что нового в модели V5?
- Гораздо более широкий стилистический диапазон и более чуткое реагирование на подсказки.
- Более высокое качество изображения (увеличение разрешения в 2 раза) улучшенный динамический диапазон.
- Изображения стали более детальные. Детали с большей вероятностью будут правильными.
- Появляется меньше нежелательного текста.
- Улучшена производительность при работе с подсказками изображений.
ВАЖНО
Сейчас в V5 нет апсемплера (увеличения) версии. Но при этом каждая из четырёх сгенерированных версий имеет разрешение по умолчанию такое же, как увеличенное изображение в V4 (для квадрата 1024 пикселя). То есть, если вы нажмёте на кнопку увеличения, это мгновенно даст вам одно изображение само по себе.
Есть ещё несколько обновлений, на которых я остановлюсь подробнее.
Пять пальцев
Версия V5 имеет много плюсов, и самый главный - приближенная к правильной анатомия рук. Все предыдущие версии рисовали лишние пальцы, часто они были ещё и кривыми, с лишними суставами. Именно за это многие критиковали Миджорни. Но с пятой версий поводов для критики стало в разы меньше. Да, пальцев иногда бывает меньше. Да, пальцы всё ещё не всегда выглядят здоровыми. Сохранилась проблема с правильным положением предметов в руках, особенно кисточек, карандашей и прочих инструментов. Но это уже огромный шаг вперёд.
Посмотрите на этих монахов - шесть рук и везде по пять пальцев.
Бесшовные текстуры
Версия --v 5 поддерживает параметр --tile для бесшовных текстур. Пока работает экспериментально, но результаты уже впечатляют. И вот это действительно отличное обновление. Создание бесшовных текстур - процесс не простой. Тем более создание замысловатых текстур. А Миджорни теперь делает их со скоростью 4 штуки в минуту размером 1024х1024 пикселя.
Разнообразие пропорций
Параметр --ar теперь поддерживает соотношение сторон более 2:1. Тоже экспериментально, и тоже качественно. Большой плюс в том, что каким бы ни было соотношение сторон, композиция сгенерируется законченной и гармоничной. Для примера на фото соотношение сторон 1:4. Хоть закладки для книг распечатывай.
Сопоставление подсказок
Этот параметр мне пока не до конца понятен, тем более что переводчики дают разные варианты перевода.
Поддерживается новый параметр --iw для взвешивания подсказок в виде изображений по сравнению с текстовыми подсказками. В другом варианте перевода используется слово "сопоставление". Предполагаю, что это аналог расставления быстрых весов, только с расставлением приоритетов на загруженное изображение или на текстовую часть промта. Раньше быстрые веса (::) для изображений не работали.
Стиль и подсказки для V5
Часто пользователи пишут в промтах объёмные литературные описания. И разработчики пошли им навстречу – вместо того, чтобы переучивать людей излагать свои мысли кратко и лаконично, научили алгоритм понимать такие промты. Вот что пишут сами разработчики:
Алгоритм V5 НАМНОГО более "беспристрастный", чем v3 и v4, и настроен так, чтобы обеспечить широкое разнообразие результатов и быть очень отзывчивым к вашим вводам. Компромисс заключается в том, что его может быть сложнее использовать.
То есть короткие подсказки могут работать не так хорошо. Для версии 5 надо написать более длинный, более четкий текст о том, что вы хотите получить. Пример от разработчиков: "кинематографическая фотография с драматическим освещением" (“cinematic photo with dramatic lighting”). То есть текст описания становится не набором словосочетаний, а предложением.
Правила сообщества
И последнее обновление Миджорни касается уже не алгоритма, а правил сообщества. Разработчики увеличили число модераторов в Дискорд-канале и улучшили инструменты модерирования. Это значит, что теперь отслеживание соблюдений правил сообщества будет более строгое и жёсткое. В случае нарушения можно получить полную блокировку.
Если было полезно - поставьте лайк и напишите "Спасибо" в комментариях. Это мотивирует меня на новые публикации! Подписывайтесь, чтобы не пропустить новые примеры работы нейросети.
Ещё на канале:
Источник фото: нейросеть Midjourney