OpenAI, компания, основанная Илоном Маском при поддержке Microsoft, уже научилась обыгрывать людей в Dota 2 и освоила искусство написания фейковых новостей. Теперь она достигла еще одной вехи с нейронной сетью DALL-E (от имени робота«Wall-E» и Сальвадора Дали), которая может создавать изображение практически из любого описания.
Например, если вы попросите «кота из суши» или «иллюстрацию химеры черепахи-жирафа», он сделает картинки, часто с поразительно хорошим качеством (а иногда и нет).
DALL-E также может рисовать и комбинировать несколько объектов и обеспечивать разные точки обзора, включая разрезы и внутреннее пространство объектов. В отличие от предыдущих программ преобразования текста в изображение, он даже выводит детали, которые не упоминаются в описании, но необходимы для реалистичного изображения. Например, по описанию «лиса, сидящая в поле зимой» агент смог определить, что на картинке нужна тень.
«В отличие от механизма 3D-рендеринга, входные данные которого должны быть указаны недвусмысленно и подробно, DALL · E часто может «восполнять пробелы», когда подразумевается, что изображение должно содержать определенные детали, которые явно не указаны», - команда OpenAI.
На данный момент возможности DALL-E довольно ограничены. Иногда он выдает то, что вы и ожидаете от описания, а иногда просто набор каких-то элементов. Как и в случае с другими системами ИИ, даже сами исследователи не всегда понимают, как именно создаются определенные изображения.
Тем не менее, при дальнейшем развитии, DALL-E имеет огромный потенциал, чтобы заменить такие сферы, как стоковые фотографии, во всех хороших и не очень смыслах.
Подписывайтесь на наш канал, где мы ежедневно радуем полезными подборками маркетинговых материалов.