3 подписчика

Текст в изображение с помощью ИИ, объяснение

22 июля 202222 июл 2022

1 мин

Генераторы, преобразующие текст в изображение с помощью искусственного интеллекта (ИИ) — это новая мощная технология, к которой мир может быть не готов. Представьте, что существует машина, которая может взять любую строку текста, которую вы набрали, и превратить ее в изображение. Например: "Инопланетный осьминог плывет через портал, читая газету" или "пара роботов ужинает с Эйфелевой башней на заднем плане". Вы можете перестать фантазировать, потому что такая возможность существует благодаря передовым генераторам текста в изображение с помощью ИИ. Для того чтобы эти генераторы работали … … им необходимо получать огромные объемы данных. Исследователи тренируют программы на наборах данных, включающих изображения с подписями, и после достаточной практики они могут выявить закономерности и начать выдавать результаты. Ключевыми игроками являются: Помимо сопоставления изображений с текстом, обе системы могут передавать изображения в широком диапазоне визуальных стилей (например, фотореализм

Оглавление

Для того чтобы эти генераторы работали …
Творческий потенциал огромен …

Генераторы, преобразующие текст в изображение с помощью искусственного интеллекта (ИИ) — это новая мощная технология, к которой мир может быть не готов.

Представьте, что существует машина, которая может взять любую строку текста, которую вы набрали, и превратить ее в изображение. Например:

"Инопланетный осьминог плывет через портал, читая газету" или "пара роботов ужинает с Эйфелевой башней на заднем плане".

Вы можете перестать фантазировать, потому что такая возможность существует благодаря передовым генераторам текста в изображение с помощью ИИ.

Для того чтобы эти генераторы работали …

… им необходимо получать огромные объемы данных. Исследователи тренируют программы на наборах данных, включающих изображения с подписями, и после достаточной практики они могут выявить закономерности и начать выдавать результаты.

Ключевыми игроками являются:

DALL-E от OpenAI, который был запущен в 2021 году и DALL-E 2, выпущенный в апреле.
Imagen от Google, который был запущен в конце мая.

Помимо сопоставления изображений с текстом, обе системы могут передавать изображения в широком диапазоне визуальных стилей (например, фотореализм против карандашного рисунка).

Творческий потенциал огромен …

… но есть проблемы. DALL-E и Imagen подвержены тем же базовым предубеждениям, что и данные, которые они поглощают. Критики утверждают, что в неумелых руках эти инструменты могут стать источником опасной дезинформации.

Другими словами, может пройти некоторое время, прежде чем вы сможете получить в свои руки любую из этих систем. OpenAI недавно открыл DALL-E 2 для избранных бета-тестеров, в то время как Google утверждает, что Imagen еще не готов к публичному использованию.

Оригинал https://thehustle.co/05252022-Text-to-image-AI-generators/