Найти тему

Midjourney v5 была выпущена: теперь нейросеть способна генерировать фотореалистичные изображения.

  • Более высокий уровень детализации, увеличенное разрешение, улучшенная отзывчивость.
    Разработчики Midjourney выпустили пятую версию своей нейросети, которая генерирует значительно более реалистичные изображения. Модель v5 использует другую нейронную архитектуру, а также новые технологии для создания стилей и эстетики. Разработка новой версии Midjourney заняла пять месяцев, о чем разработчики сообщили на официальном сервере проекта в Discord.

    Пятое поколение в настоящее время проходит альфа-тестирование, и разработчики предупреждают, что нейросеть может претерпеть значительные изменения до ее полноценного релиза. Тем не менее, поколение уже доступно пользователям для тестирования.

    Вот изменения, внесенные в Midjourney v5.
    Стилистика.
    В пятой версии Midjourney был расширен стилистический диапазон, и он стал более искусно интерпретировать запросы. Влияние указания имени художника или художественного стиля теперь более заметно. Если стиль не указан, нейронная сеть по умолчанию создает фотореалистичные изображения.
    Качество. В версии Midjourney v5 разрешение было увеличено вдвое, а также улучшен динамический диапазон. Изображения теперь генерируются в высоком качестве мгновенно. В версии 4 каждое изображение приходилось масштабировать вручную, а пользователям приходилось ждать обработки запроса. Теперь кнопка «Вверх по шкале» мгновенно открывает увеличенную картинку.
    Детализация. Новая версия нейросети лучше справляется с мелкими деталями, такие как создание изображений с пятью пальцами на руках и нормальным количеством зубов. Кроме того, разработчики сообщили, что детализация лиц была улучшена «драматически».
    Работа с запросами. Разработчики отмечают, что короткие запросы, состоящие всего из пары слов, могут не работать так же хорошо, как раньше, поэтому рекомендуется придумывать более длинные и детальные запросы. К примеру, использование фразы "Бегущий слон на беговой дорожке" приведет к более предсказуемым результатам, чем фраза "Слон, бежит, беговая дорожка".
                              Midjourney v4                                                      Midjourney v5
Midjourney v4 Midjourney v5

Какие новые функции были добавлены в Midjourney v5
В экспериментальном режиме в Midjourney v5 были добавлены три новые функции, но разработчики предупредили, что они могут работать не всегда корректно.

  1. Одна из новых функций - поддержка бесшовных изображений. Для генерации текстур в конце запроса нужно добавить --tile. Однако, эта опция не очень хорошо справляется с созданием реалистичных изображений, но может быть полезна для создания минималистичных рисунков для фона и текстуры.
  2. Midjourney v5 поддерживает любые соотношения сторон. Эта функция позволяет генерировать изображения с любыми соотношениями сторон, включая экстремальные 1:100. В предыдущей версии диапазон был ограничен от 1:2 до 2:1. Такая опция позволяет создавать панорамные и 360-градусные фотографии с высоким качеством, поскольку нейросеть лучше справляется с нестандартными пропорциями.
  3. «Весы» для изображений. В 5 версии добавлена возможность настройки степени сходства между сгенерированным и референсным изображениями при помощи параметра --iw. Значение данного параметра может быть от 0,5 до 2, по умолчанию оно равно 1. Установка параметра --iw 0,5 сделает сгенерированное изображение менее похожим на референсное, а значение --iw 2, наоборот, увеличит степень сходства между изображениями.