Я новичок, я здесь не буду сравнивать алгоритмы, и выяснять кто круче. Потому что это вообще не интересно. Я беру эти две сети, потому что они больше других на слуху и с ними двумя мне удалось уже поработать.
Поделюсь тем, что я понял взглядом новичка для новичков.
И та и та сеть "рисует картинки" назовём это так, в чем же между ними разница? Давайте разбираться по порядку.
Первая MidJourney. https://www.midjourney.com/home/
Это коммерческий проект. Ключевая особенность - работает на удаленных серверах. Все общение с нейросетью организовано через чат в Discord. Вы отправляете в неё запросы (они же промпты) она вам рисует картинки. У вас есть бесплатно 25 условных GPU минут. Сколько это в реальной работе? Ну -+ 25 попыток. Каждый раз она выдает 4 варианта, вы дальше думаете, какой вариант можно увеличить или покрутить ещё.
Более дружелюбен по сравнению со Stable Diffusion, разобраться может даже ребёнок и надо признать, что при одинаковых промптах MidJourney выдает более качественный результат в сравнении с базовыми чекпоинтами Stable Diffusion. Большим плюсом является работа на железе разработчика. То есть арты можно получать на чём угодно, где встанет Discord. Хоть на телефоне, но с какого то момента за генерации придётся платить, хотя некоторые просто регистрируют новый акк и по новой. Что по денюжке? от 8$ за 4 часа GPU-часов в месяц до 30$ за 16 часов. По мне так очень даже по божески, только нужна карта заграничного банка. Дешевле пользования любым фотобанком.
Что с недостатками? Это только картинки. Да картинки хорошие, но перспективы движения к видео я не заметил.
Stable Diffusion - это уже совсем другая история. Она монтируется локально на машине и её возможности ограничены видеокартой. Хотя есть возможность запустить её в Google Colab и все расчёты переложить на мощности Google.
Stable Diffusion cоздается и развивается энтузиастами на GitHab'е и чтобы установить и завести надо немного поморочиться. Никакого удобного инсталятора в два клика. Cкачайте программу А, потом программу Б, запустите через коммандную строку выражение В, потом скачайте нужный вам чекпоинт(штоа?) и положите в папку Г. Возможно ничего не заработает, тогда возможно вы что то пропустили и попробуйте начать сначала. И тд Интерфейсом выступает обычный браузер и его дружелюбностью никто не заморачивается. Но зато никаких ограничений, ежедневно появляются новые плагины и расширения, обновляются и создаются новые чекпоинты движка.
И тут как раз и начинается самое интересное. Вот вам DreamBooth для юзерпиков, вот вам Deforum для видео, вот мы вам из вашей картинки карту глубины и карту нормалей нарисуем и так далее и тому подобное. И черт его знает, что появится завтра. Плюсы? Это открытая архитектура и бесплатное использование. Минусы? Нужно мощное железо в компе, и если это можно хотя бы как то обойти через Google Colab и не менее мощные нервы и железо в голове. Мне разбить клавиатуру пару раз хотелось. Потому что повторюсь никакого дружелюбного интерфейса нет и не планировалось, это всё делается ботанами для других таких же ботанов. Если вы себя к таким относите, то добро пожаловать в безграничные возможности Stable Diffusion! И если нет, то Midjourney ваш вариант.
Ещё одно отличие MidJourney от Stable Diffusion, то что она может постоянно дообучаться. Так как всё это происходит на серверах компании, и мы не знаем что там происходит под капотом, наверняка реакции пользователей на полученные креативы в чате дискорда и реакция пользователей на результаты выдачи принять/не принять тоже влияют на дальнейшие рендера. Stable Diffusion существует в виде разделенных и не связанных друг с другом чекпоинтов или моделей у пользователей. И по сути сама развиваться не может.
Это всё что удалось отметить к данному моменту. Будем изучать дальше)