Достижения искусственного интеллекта (ИИ) теперь позволяют каждому желающему создавать великолепные произведения искусства в виде изображений, которые человеку сложно или даже невозможно создать вручную.
Давайте рассмотрим два популярных метода генерации изображений.
1. Модели преобразования текста в изображение
Модели преобразования текста в изображение генерируют изображения на основе текстового описания. Эти модели обучаются на наборе уже созданных ранее изображений и соответствующих им текстовых описаниях. И они учатся генерировать изображения, соответствующие описанию.
Одним из способов создания изображений с использованием модели преобразования текста в изображение является использование архитектуры кодировщика-декодера, при которой текст преобразуется в компактный код, а затем используется для создания изображения (этот метод называется вариационным автоэнкодером или VAE).
Другой способ — использование генеративно-состязательной сети, где текстовое описание используется в качестве руководства для создания изображения.
Некоторые из наиболее популярных моделей преобразования текста в изображение — Stable Diffusion, DALL-E 2 и Imagen.
Генеративно-состязательная сеть
Генеративно-состязательная сеть (GAN) может генерировать новые данные, аналогичные набору обучающих данных.
GAN состоит из двух частей: генератора и дискриминатора. Генератор создает новые данные, которые должны выглядеть похожими на оригинал, а дискриминатор пытается выяснить - настоящие или поддельные новые данные. Они играют друг с другом в игру, где генератор пытается обмануть дискриминатор, а дискриминатор пытается поймать генератор. Генератор становится лучше каждый раз, когда он обманывает дискриминатор, а дискриминатор становится лучше каждый раз, когда он ловит генератор.
2. Модели переноса стиля
Модели переноса стиля позволяют сформировать изображение в стиле конкретного художника или картины. Эти модели обучаются на наборе данных изображений и соответствующих им стилях. И учатся применять стиль одного изображения к содержимому другого изображения.
DALL-E и DALL-E 2
DALL-E и DALL-E 2 — модели генерации изображений глубокого обучения, разработанные OpenAI. Они способны генерировать изображения с высоким разрешением на основе описаний на естественном человеческом языке. DALL-E 2 может генерировать как абстрактные, так и очень подробные изображения из текста.
Эти модели также можно использовать для редактирования существующих изображений в соответствии с заданным описанием.
DALL-E — это новаторское исследование от OpenAI, целью которого является облегчить обычным людям получение сверхспособностей в изобразительном искусстве.
Эти модели в настоящее время являются частными, но DALL-E Mini — это потрясающая реализация технологии с открытым исходным кодом, которая пытается воспроизвести те же результаты.
OpenAI считается одной из лучших исследовательских лабораторий искусственного интеллекта в мире. Организация разработала революционные модели обработки естественного языка (НЛП) и компьютерного зрения, ускоряя прогресс на пути к более продуктивному и развитому обществу, основанному на искусственном интеллекте.
Модель НЛП, получившая название GPT-3, считается одним из самых значительных прорывов в области ИИ за последние годы и может имитировать качество человеческого уровня при выполнении многих письменных задач.
Многие люди используют GPT-3 для копирайтинга, маркетинга продуктов, аннотаций книг и множества других писательских задач. Можете попробовать это сделать прямо сейчас вот здесь: AI Sparkwriter.
Модель компьютерного зрения Dall-E 2 не только представляет собой революционное исследование, но и, похоже, взорвет Интернет своими потрясающими изображениями и магическими возможностями. Однако OpenAI решила проявить осторожность и сохранить модель конфиденциальной в целях безопасности.
Хотя Dall-E 2 остается частной собственностью, есть альтернативный генератор AI Art Generator, который вы можете попробовать.
Посмотрите на изображения, которые получились у меня (по разным текстовым описаниям):
Сборник лучших курсов для начинающих нейрохудожников и опытных дизайнеров:
Друзья, если вы не хотите погружаться в обучение, но хотите нейрофотографии со своим лицом - напишите мне об этом в ВК.