Найти в Дзене
Sunday Magazine

Текст в изображение с помощью ИИ, объяснение

Генераторы, преобразующие текст в изображение с помощью искусственного интеллекта (ИИ) — это новая мощная технология, к которой мир может быть не готов. Представьте, что существует машина, которая может взять любую строку текста, которую вы набрали, и превратить ее в изображение. Например: "Инопланетный осьминог плывет через портал, читая газету" или "пара роботов ужинает с Эйфелевой башней на заднем плане". Вы можете перестать фантазировать, потому что такая возможность существует благодаря передовым генераторам текста в изображение с помощью ИИ. Для того чтобы эти генераторы работали … … им необходимо получать огромные объемы данных. Исследователи тренируют программы на наборах данных, включающих изображения с подписями, и после достаточной практики они могут выявить закономерности и начать выдавать результаты. Ключевыми игроками являются: Помимо сопоставления изображений с текстом, обе системы могут передавать изображения в широком диапазоне визуальных стилей (например, фотореализм
Оглавление

Генераторы, преобразующие текст в изображение с помощью искусственного интеллекта (ИИ) — это новая мощная технология, к которой мир может быть не готов.

Google via The Verge. Фото с сайта https://thehustle.co/wp-content/uploads/2022/05/HS-News-Brief_2022-05-25T003630.338Z-768x448.png
Google via The Verge. Фото с сайта https://thehustle.co/wp-content/uploads/2022/05/HS-News-Brief_2022-05-25T003630.338Z-768x448.png

Представьте, что существует машина, которая может взять любую строку текста, которую вы набрали, и превратить ее в изображение. Например:

"Инопланетный осьминог плывет через портал, читая газету" или "пара роботов ужинает с Эйфелевой башней на заднем плане".

Вы можете перестать фантазировать, потому что такая возможность существует благодаря передовым генераторам текста в изображение с помощью ИИ.

Для того чтобы эти генераторы работали …

… им необходимо получать огромные объемы данных. Исследователи тренируют программы на наборах данных, включающих изображения с подписями, и после достаточной практики они могут выявить закономерности и начать выдавать результаты.

Ключевыми игроками являются:

  • DALL-E от OpenAI, который был запущен в 2021 году и DALL-E 2, выпущенный в апреле.
  • Imagen от Google, который был запущен в конце мая.

Помимо сопоставления изображений с текстом, обе системы могут передавать изображения в широком диапазоне визуальных стилей (например, фотореализм против карандашного рисунка).

Творческий потенциал огромен …

… но есть проблемы. DALL-E и Imagen подвержены тем же базовым предубеждениям, что и данные, которые они поглощают. Критики утверждают, что в неумелых руках эти инструменты могут стать источником опасной дезинформации.

Другими словами, может пройти некоторое время, прежде чем вы сможете получить в свои руки любую из этих систем. OpenAI недавно открыл DALL-E 2 для избранных бета-тестеров, в то время как Google утверждает, что Imagen еще не готов к публичному использованию.

Оригинал https://thehustle.co/05252022-Text-to-image-AI-generators/