- Более высокий уровень детализации, увеличенное разрешение, улучшенная отзывчивость.
Разработчики Midjourney выпустили пятую версию своей нейросети, которая генерирует значительно более реалистичные изображения. Модель v5 использует другую нейронную архитектуру, а также новые технологии для создания стилей и эстетики. Разработка новой версии Midjourney заняла пять месяцев, о чем разработчики сообщили на официальном сервере проекта в Discord.
Пятое поколение в настоящее время проходит альфа-тестирование, и разработчики предупреждают, что нейросеть может претерпеть значительные изменения до ее полноценного релиза. Тем не менее, поколение уже доступно пользователям для тестирования.
Вот изменения, внесенные в Midjourney v5.
Стилистика. В пятой версии Midjourney был расширен стилистический диапазон, и он стал более искусно интерпретировать запросы. Влияние указания имени художника или художественного стиля теперь более заметно. Если стиль не указан, нейронная сеть по умолчанию создает фотореалистичные изображения.
Качество. В версии Midjourney v5 разрешение было увеличено вдвое, а также улучшен динамический диапазон. Изображения теперь генерируются в высоком качестве мгновенно. В версии 4 каждое изображение приходилось масштабировать вручную, а пользователям приходилось ждать обработки запроса. Теперь кнопка «Вверх по шкале» мгновенно открывает увеличенную картинку.
Детализация. Новая версия нейросети лучше справляется с мелкими деталями, такие как создание изображений с пятью пальцами на руках и нормальным количеством зубов. Кроме того, разработчики сообщили, что детализация лиц была улучшена «драматически».
Работа с запросами. Разработчики отмечают, что короткие запросы, состоящие всего из пары слов, могут не работать так же хорошо, как раньше, поэтому рекомендуется придумывать более длинные и детальные запросы. К примеру, использование фразы "Бегущий слон на беговой дорожке" приведет к более предсказуемым результатам, чем фраза "Слон, бежит, беговая дорожка".
Какие новые функции были добавлены в Midjourney v5
В экспериментальном режиме в Midjourney v5 были добавлены три новые функции, но разработчики предупредили, что они могут работать не всегда корректно.
- Одна из новых функций - поддержка бесшовных изображений. Для генерации текстур в конце запроса нужно добавить --tile. Однако, эта опция не очень хорошо справляется с созданием реалистичных изображений, но может быть полезна для создания минималистичных рисунков для фона и текстуры.
- Midjourney v5 поддерживает любые соотношения сторон. Эта функция позволяет генерировать изображения с любыми соотношениями сторон, включая экстремальные 1:100. В предыдущей версии диапазон был ограничен от 1:2 до 2:1. Такая опция позволяет создавать панорамные и 360-градусные фотографии с высоким качеством, поскольку нейросеть лучше справляется с нестандартными пропорциями.
- «Весы» для изображений. В 5 версии добавлена возможность настройки степени сходства между сгенерированным и референсным изображениями при помощи параметра --iw. Значение данного параметра может быть от 0,5 до 2, по умолчанию оно равно 1. Установка параметра --iw 0,5 сделает сгенерированное изображение менее похожим на референсное, а значение --iw 2, наоборот, увеличит степень сходства между изображениями.