Сейчас немножко поговорим о том, кто отвечает за визуальную составляющую статей от нашей команды нейросетей. Встречайте, великий и ужасный MidJourney! Будет много красоты, приготовьтесь.
Сначала я надеялся, что ChatGPT сможет в своём фирменном стиле представить своего напарника, но, к сожалению, даже у последней версии нейросети нет соответствующих данных (ChatGPT пока не знает ничего о происходящем в мире после 2021 года, так как не имеет прямого доступа в интернет и получает данные по мере обновления разработчиками).
Но нейросеть в целом знакома с технологией, поэтому давайте посмотрим, что она нам пишет:
"Нейросети, создающие изображения на основе текстового описания, известны как генеративные сети, и они действительно представляют собой удивительные достижения в области искусственного интеллекта.
Один из наиболее известных примеров таких нейросетей - DALL-E, разработанный компанией OpenAI. DALL-E способен создавать изображения по текстовым описаниям, используя архитектуру, похожую на GPT. Нейросеть обучается на огромном количестве текстов и изображений, чтобы научиться понимать текстовые описания и генерировать соответствующие изображения.
Такие нейросети открывают новые возможности в области искусства, дизайна и создания контента. Они позволяют художникам и дизайнерам быстрее создавать визуальные концепты и идеи, а также преодолевать языковые барьеры, переводя текстовые описания в универсальный язык изображений."
Спасибо, ChatGPT, довольно познавательно!
Давайте сначала разберёмся, почему мы будем использовать именно MidJourney, а не, например, тот же DALL-E, про который нам рассказывает ChatGPT.
Попробуем ввести один из запросов, предложенных ChatGPT, в обе нейросети и сравним результаты.
"Космическая станция, орбитирующая вокруг земли, с видом на звездное небо и далекие планеты." (окей, ChatGPT, ждём лайк от тех, кто хоть раз говорил слово "орбитирующая" 😅)
Начнём с DALL-E (листаем карусель):
Выглядит достойно. Особенно учитывая тот факт, что это не какие-то картинки из интернета, а рисунки, сгенерированные за несколько секунд просто по текстовому описанию.
Теперь очередь нашего друга MidJourney (листаем карусель):
Воу! Давайте честно, я в шоке. Всего несколько слов в запросе, и у нас готов настоящий электронный шедевр.
Но это только начало. Небольшой спойлер: следующее сравнение даст нам абсолютно однозначно понять, почему мы выбираем именно MidJourney.
В предыдущем посте мы уже использовали картинку, которую сделал MidJourney по запросу "a team of programmers in the process of developing complex software related to neural networks":
Сочно, красиво, фотореалистично! Про пальцы мы уже говорили, не будем на этом останавливаться. Детали действительно поражают.
Что же нам покажет DALL-E?
K P A C U B O 😆
Напомнило одного мемного голубя из игры:
Думаю, теперь мы разобрались, почему именно MidJourney.
Давайте посмотрим ещё несколько работ, которые мы только что сделали с этой нейросетью по запросам от ChatGPT:
"Закат на берегу океана с силуэтами пальм и пляжными зонтиками"
"Волшебный лес с деревьями, усыпанными светящимися бабочками и цветами"
"Водопад в тропических джунглях с разноцветными попугаями и прыгающими обезьянами" (обезьян я тут почему-то не увидел)
"Подводный мир с коралловыми рифами, рыбами-клоунами и медузами, светящимися в темноте"
В последнем запросе я случайно объединил сразу два, и получилось даже лучше, чем планировалось:
"Город будущего с небоскребами, летающими автомобилями и парящими парками.
Мир фантазии с драконами, единорогами и волшебными замками на облаках."
Ну что, молчаливый, но талантливый MidJourney, добро пожаловать в нашу команду! Пишите в комментариях, восхищают ли вас картины от нейросетей, или это не искусство, а просто бездушный набор пикселей.
А мы уже с нетерпением ждём представления нашего участника из команды-оппонента!