Найти тему
Not found question

Нейросеть DALL-E 2, что это такое

Оглавление

История


DALL-E это нейросеть созданная компанией OpenAI (одним из основателей которой является Илон Маск) первая версия была показана 5 января 2021 года.

Но сама разработка началась еще в 2018 году, а уже в 2019 году Microsoft выделила OpenAI грант в 1 млрд $ на разработку инновационных технологий в сфере искусственного интеллекта.

DALL-E 2

6 апреля 2022 года была анонсирована DALL-E 2

Преимущества DALL-E 2 перед DALL-E:

  • более высокое разрешение изображений
  • обработка запросов более чем на 107 языков мира, в том числе на русский
  • можно задавать цветовые фильтры и стиль изображения
  • возможность дорисовывать загруженное изображение
  • может взять существующее изображение в качестве входных данных и создать его творческую вариацию

Так же доработанная версия теперь генерирует до четырёх раз более качественные изображения, чем предыдущая. Результат получается быстрее и в размере 1024×1024 пикселей вместо 256×256 пикселей.

Что из себя представляет DALL-E 2

DALL-E 2- это алгоритм нейронной сети, который создает картинку из предоставленной вами короткой фразы или предложения.

Примеры работ:

Мудрый кот медитирует в Гималаях в поисках просветления

-2

Робот рисует на холсте, играя при этом на пианино

-3

Астронавт верхом на коне

-4

Технобуйвол

-5

Бэтмобиль в стиле киберпанк едет по Готэму из будущего

-6

Так же нейросеть может брать изображение и создавать различные его вариации, изменяя композицию, тени и текстуру.

Еще одна функция это добавлять и удалять новые объекты и редактировать фотографии. DALL-E 2 может, например, добавить объект в интерьер или заменить одну его деталь на другую.

Например:

-7

Недостатки

Конечно, нейросеть еще далека от совершенства. Так, например, пользователи обнаружили, что она не умеет считать. Если ввести запрос «семь красных яблок на стеклянном блюдце», то на картинке будет несколько яблок — но не факт, что именно семь. Также DALL-E 2 теряется, если запросить слишком много деталей.

Похожие нейросети

Помимо DALL-E 2 есть также много других нейросетей, которые генерируют фото по описанию

Компания Google (вернее, ее исследовательское отделение Google Brain) представила собственную нейросеть Imagine немногим позже DALL·E 2 — в мае 2022-го. Обучали ее на базе из 400 миллионов готовых пар изображений и текстовых описаний. (Пока что находиться в тестовом режиме)

2. MIDJOURNEY

Проект одноименной независимой исследовательской лаборатории под руководством бывшего инженера NASA сейчас тоже на стадии бета-тестирования. Как и остальные, Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.

3. RUDALL-E

Команда отечественных разработчиков (среди них сотрудники Sber AI) запустила российский аналог генератора в конце 2021-го

  • ruDALL-E Kandinsky можно запустить в Discord или приложении Сбера Салют с помощью голосовой команды.
  • ruDALL-E Malevich доступна на сайте или в Telegram-боте Сбера.
  • Еще есть uDALL-E Emojich, которая генерирует смайлики по текстовому запросу — она тоже доступна на сайте или через бота.

Так же есть и другие нейросети.

Примечания

Нейросеть DALL-E 2 еще не работает в России, но если хочется опробовать уже сейчас вот инструкция.

Заключение

С каждым годом возможности нейросетей растут, и, возможно, в скором будущем они будут не заменимы в нашей повседневной жизни.

Если вы заметили ошибку или некорректную информацию, пожалуйста, сообщите об этом. Если вам понравился разбор, оцените статью и напишите, о чем сделать следующую работу.