Проведём сравнение нескольких известных нейросетей для создания изображений, таких как Stable Diffusion, Midjourney, Flux и Dalle-3.
Каждая из этих моделей имеет свои уникальные особенности. Мы сопоставим результаты генерации изображений с применением разных стилей, чтобы определить, какая из них лучше всего справляется с конкретными задачами. Аналоги Midjourney, Dalle, Flux и Stable Diffusion.
Сравнение нейросетей для генерации картинок
Я применяю множество нейронных сетей для генерации текста, изображений, аудио и видео. Пробовал разные платформы и, в конечном итоге, выбрал онлайн-сервис в мессенджере Telegram, который предоставляет возможность работать с различными нейросетями на русском языке без необходимости использования VPN.
Начнём с нейросети Flux и создадим несколько изображений по простым запросам.
промпт 1: "Дональд Дак держит в руках золотую монету"
промпт 2: "Девушка сидит на траве на фоне гор"
Нейросеть Flux онлайн
Для того чтобы приступить к работе с нейросетью Flux, заходим в телеграм-бота, затем в меню нажимаем на "Нейросеть" и выбрать "Flux"
Посмотрим что получилось в результате выполнения наших запросов:
Одним из ярких преимуществ нейросети Flux является ее способность генерировать правдоподобные и реалистичные изображения людей, при этом без искажений конечностей. Для более глубокого ознакомления с этой нейронной сетью вы можете обратиться в этой статье.
Советую попробовать генерации в разных стилях. В разделе "Стили" в меню бота доступно более 40 вариантов, которые можно использовать для создания картинок в каждой нейросети.
Для примера применим несколько стилей для первого изображения: "Steampunk", "Logo", "Horror", "Space"
Для второго изображения используем следующие стили: "Anime", "Gothic", "Comicbook", "Futuristic"
Как мы видим нейросеть успешно справилась с генерациями и применила выбранные нами стили к изображениям.
Как написать текст на изображениях в нейросети Flux
Эта нейросеть прекрасно выполняет задачу интеграции текста на изображениях, но пока только на английском языке.
Промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"
В большинстве случаев желаемый результат достигается с первой попытки.
Совмещение персонажей в нейросети Flux
Чтобы создать более оригинальные и креативные произведения, можно объединить разных персонажей в одной картине.
Промпт: "Комбинация дональда дака и стрекозы"
Иногда генерации оказываются довольно увлекательными. Всё зависит от вашей креативности.
Чтобы научиться создавать более сложные промпты и отточить свои навыки работы с различными нейронными сетями, советую пройти обучение поэтапно в области искусственного интеллекта.
Нейросеть DALLE 3 онлайн
Предлагаю рассмотреть аналог Flux – нейросеть Dalle 3.
На этой платформе доступен бесплатный доступ к Далли, поскольку в боте ежедневно предоставляется несколько баллов, которые можно использовать для генераций.
В меню выбираем нейросеть "Dalle" и активируем режим "Multi-image"
Отправим на генерацию те же промпты и сравним результаты.
промпт 1: "Дональд Дак держит в руках золотую монету"
промпт 2: "Девушка сидит на траве на фоне гор"
Добавим к нашим запросам стили, которые применяли ранее.
Как написать текст на изображениях в нейросети Dalle-3
Далли тоже довольно успешно выполняет задачу интеграции английского текста на изображениях, хотя иногда могут возникать ошибки.
Используем предыдущий промпт: "Дональд дак держит золотую монету в руке с надписью "Rich"
Давайте проверим, как Далли выполнит задачу c сочетанием персонажей.
Промпт: "Комбинация дональда дака и стрекозы"
Я опубликовал статью, в которой представлена более полная информация о нейросети Dalle 3.
Нейросеть Midjourney онлайн
Не могу не отметить одну из самых популярных нейронных сетей: Миджорни - аналог Dalle 3 и Flux.
Некоторые люди используют Миджорни через Discord, однако для множества пользователей это может быть неудобно из-за ряда недостатков. К ним относятся ограничения на оплату с определенных карт, необходимость использования VPN и другие обстоятельства.
Когда применяется нейросеть через бота в Telegram, таких проблем не наблюдается.
Вы можете воспользоваться последней версией Midjourney v 6.1, которая предлагает все основные функции и дополнительные возможности.
Как пользоваться нейросетью Миджорни онлайн на русском языке
Переходим в меню бота к нейросети Midjourney и сравним результаты генераций с предыдущими нейронками.
Хочу приложить примеры генераций изображений в стилях, которые мы использовали до этого.
Как написать текст на изображениях в нейросети Midjourney
Сгенерируем картинку оп прежнему запросу: "Дональд дак держит золотую монету в руке с надписью "Rich"
Вот генерация, полученная в результате объединения персонажей.
В Midjourney доступен широкий спектр дополнительных возможностей, настроек и специальных команд. Вы можете создавать различные версии персонажей, дополнить фон, увеличивать размеры картинки с переработкой деталей, комбинировать два изображения в одно и пр.
Ключевым аспектом является то, что в данном боте существует возможность взаимодействия нейронных сетей между собой.
После создания изображения через нейросети: Midjourney, Dalle или Flux, существует возможность воспользоваться функцией "Inpaint" от Stable Diffusion для дополнительной обработки изображения. Это позволит удалить ненужные элементы, поменять фон, скорректировать определенные детали, заменить лицо на фото и многое другое.
Нейросеть Stable Diffusion онлайн
Рассмотрим результаты генерации с использованием нейросети Stable Diffusion.
Сравним изображения сгенерированные в Stable Diffusion с применением стилей.
Следовательно, мы можем сделать генерацию по одному запросу на нескольких нейронных сетях в одной платформе, сравнить результаты и выбрать наилучший вариант.
В настоящее время Stable Diffusion не генерирует изображения с текстом, который содержится в запросе, однако успешно справляется с объединением персонажей.
Для этого нужно использовать промпт: [дональд дак:стрекоза:0.5].
Это позволит нейросети сначала сформировать изображение первого героя наполовину, а затем интегрировать второго.
Stable Diffusion обладает множеством преимуществ, среди которых разнообразие моделей, возможность выбора сэмплеров, разные форматы изображений, конструктор изображений, функция замены лиц на фотографиях, возможность применения моделей "LoRa" и многое другое.
В этом сервисе пользователи могут бесплатно протестировать ряд функций, так как ежедневно предоставляется определенное количество баллов для генерации изображений.
Если вас интересует тема нейронных сетей, рекомендую начать с изучения искусственного интеллекта поэтапно и применять приобретенные знания для решения практических задач в различных сферах.