3 подписчика

Знакомство с участниками: MidJourney

21 апреля 202321 апр 2023

3 мин

Сейчас немножко поговорим о том, кто отвечает за визуальную составляющую статей от нашей команды нейросетей. Встречайте, великий и ужасный MidJourney! Будет много красоты, приготовьтесь.

Сначала я надеялся, что ChatGPT сможет в своём фирменном стиле представить своего напарника, но, к сожалению, даже у последней версии нейросети нет соответствующих данных (ChatGPT пока не знает ничего о происходящем в мире после 2021 года, так как не имеет прямого доступа в интернет и получает данные по мере обновления разработчиками).

Но нейросеть в целом знакома с технологией, поэтому давайте посмотрим, что она нам пишет:

"Нейросети, создающие изображения на основе текстового описания, известны как генеративные сети, и они действительно представляют собой удивительные достижения в области искусственного интеллекта.

Один из наиболее известных примеров таких нейросетей - DALL-E, разработанный компанией OpenAI. DALL-E способен создавать изображения по текстовым описаниям, используя архитектуру, похожую на GPT. Нейросеть обучается на огромном количестве текстов и изображений, чтобы научиться понимать текстовые описания и генерировать соответствующие изображения.

Такие нейросети открывают новые возможности в области искусства, дизайна и создания контента. Они позволяют художникам и дизайнерам быстрее создавать визуальные концепты и идеи, а также преодолевать языковые барьеры, переводя текстовые описания в универсальный язык изображений."

Спасибо, ChatGPT, довольно познавательно!

Давайте сначала разберёмся, почему мы будем использовать именно MidJourney, а не, например, тот же DALL-E, про который нам рассказывает ChatGPT.

Попробуем ввести один из запросов, предложенных ChatGPT, в обе нейросети и сравним результаты.

"Космическая станция, орбитирующая вокруг земли, с видом на звездное небо и далекие планеты." (окей, ChatGPT, ждём лайк от тех, кто хоть раз говорил слово "орбитирующая" 😅)

Начнём с DALL-E (листаем карусель):

Выглядит достойно. Особенно учитывая тот факт, что это не какие-то картинки из интернета, а рисунки, сгенерированные за несколько секунд просто по текстовому описанию.

Теперь очередь нашего друга MidJourney (листаем карусель):

Воу! Давайте честно, я в шоке. Всего несколько слов в запросе, и у нас готов настоящий электронный шедевр.

Но это только начало. Небольшой спойлер: следующее сравнение даст нам абсолютно однозначно понять, почему мы выбираем именно MidJourney.

В предыдущем посте мы уже использовали картинку, которую сделал MidJourney по запросу "a team of programmers in the process of developing complex software related to neural networks":

Сочно, красиво, фотореалистично! Про пальцы мы уже говорили, не будем на этом останавливаться. Детали действительно поражают.

Что же нам покажет DALL-E?

K P A C U B O 😆

Напомнило одного мемного голубя из игры:

Думаю, теперь мы разобрались, почему именно MidJourney.

Давайте посмотрим ещё несколько работ, которые мы только что сделали с этой нейросетью по запросам от ChatGPT:

"Закат на берегу океана с силуэтами пальм и пляжными зонтиками"

"Волшебный лес с деревьями, усыпанными светящимися бабочками и цветами"

"Водопад в тропических джунглях с разноцветными попугаями и прыгающими обезьянами" (обезьян я тут почему-то не увидел)

"Подводный мир с коралловыми рифами, рыбами-клоунами и медузами, светящимися в темноте"

В последнем запросе я случайно объединил сразу два, и получилось даже лучше, чем планировалось:

"Город будущего с небоскребами, летающими автомобилями и парящими парками.
Мир фантазии с драконами, единорогами и волшебными замками на облаках."

Ну что, молчаливый, но талантливый MidJourney, добро пожаловать в нашу команду! Пишите в комментариях, восхищают ли вас картины от нейросетей, или это не искусство, а просто бездушный набор пикселей.

А мы уже с нетерпением ждём представления нашего участника из команды-оппонента!