Найти тему
Нейросети и дизайн.

Новая Stable Diffusion 3.0 лучшая нейросеть для генерации изображений?

Недавно компания stability.ai анонсировала третью версию Stable Diffusion. Сегодня я расскажу чем она отличается от предыдущей.

Stable Diffusion - это алгоритм генеративного искусственного интеллекта, который преобразует текстовые описания в изображения с помощью диффузионных моделей. Последняя версия 2.0 привнесла множество улучшений и обновлений по сравнению с предыдущей версией. В этой статье мы рассмотрим, что нового предлагает Stable Diffusion 3.0, какие обновления были внесены в алгоритм, и как это влияет на генерацию изображений.

Stable Diffusion 3.0 - это не просто обновление, это совершенно новый уровень возможностей. Благодаря новой архитектуре и улучшенному качеству, ИИ стал еще более творческим и точным в своих творениях. Одной из главных особенностей Stable Diffusion 3.0 является его более точное понимание промт.

Ниже я приведу пример как каждая из популярных нейросетей понимает один и тот же промпт (Фотография красной сферы на вершине синего куба. За ними зеленый треугольник, справа собака, слева кот.) в сравнении с Stable Diffusion 3.0.

Изображения сгенерировал другой пользователь, который получил ранний доступ к Stable Diffusion 3.0

Как мы видим лучше всех промпт понял Stable Diffusion 3.0, а Dall-E 3 так вообще забил на ваши пожелания.
Как мы видим лучше всех промпт понял Stable Diffusion 3.0, а Dall-E 3 так вообще забил на ваши пожелания.

А так справилась предыдущая версия Stable Diffusion.

Результат оставляет желать лучшего.
Результат оставляет желать лучшего.

Теперь искусственный интеллект гораздо лучше адаптируется к индивидуальным предпочтениям и запросам пользователя, что позволяет создавать произведения искусства, полностью соответствующие их ожиданиям. Точное понимание промта, это чего на данный момент не хватает нейронкам, помимо того что ты хочешь видеть на изображении они часто добавляют лишних элементов. В особенности этим грешит Midjourney.

Основные обновления Stable Diffusion 3.0

  1. Улучшение качества изображений: Stable Diffusion 3.0 включает в себя ряд улучшений, направленных на повышение качества генерируемых изображений, таких как улучшение разрешения и детализации, а также улучшение цветового баланса.
  2. Ускорение процесса генерации: Благодаря оптимизации процесса обучения и улучшениям в архитектуре модели, Stable Diffusion 3.0 может генерировать изображения быстрее, чем предыдущие версии.
  3. Более широкая поддержка языков: Stable Diffusion 3.0 поддерживает больше языков для текстовых описаний, что позволяет пользователям создавать изображения, соответствующие их языковым предпочтениям.
  4. Улучшено понимание текста. То есть когда вы прописываете промт например: напиши на кирпичной стене "Я тебя люблю", то он так и напишет, в отличии от белеберды которую нейронки писали раньше.

Заключение

Stable Diffusion продолжает развиваться и совершенствоваться, предлагая все более качественные и быстрые результаты генерации изображений. Версия 3.0 представляет собой значительное обновление алгоритма, которое улучшает качество изображений, ускоряет процесс генерации и расширяет языковую поддержку. Это делает Stable Diffusion еще более привлекательным для пользователей и разработчиков, работающих в области генеративного искусства и искусственного интеллекта.

Ниже приведу несколько примеров картинок, которые сгенерировал Stable Diffusion 3.0. Изображения были показаны самим stability.ai

-4
-5
-6
-7