Искусственный интеллект стремительно расширяет свои возможности, постоянно удивляя нас своими достижениями. На этот раз компания Google преподнесла миру очередной технологический прорыв в области генерации визуального контента.
На ежегодном мероприятии Google I/O 2024, ориентированном на разработчиков, технологический гигант представил следующее поколение своей модели искусственного интеллекта для преобразования текста в изображение – Imagen 3. Этот новый ИИ-инструмент, как утверждает компания, способен создавать невероятно детализированные и фотореалистичные изображения, точно следуя даже самым сложным и креативным инструкциям.
Представляя Imagen 3, старший директор по исследованиям Google DeepMind Дуглас Эк отметил: "Сегодня я очень рад представить Imagen 3. Это наша самая мощная модель генерации изображений. Он понимает подсказки, написанные так, как пишут люди. Чем креативнее и детальнее вы будете, тем лучше.
По словам Google, способность модели ИИ понимать подсказки была значительно усовершенствована, что позволяет ей точно улавливать мелкие детали и генерировать изображения, максимально соответствующие инструкциям. Для этого модель была обучена на изображениях с подробными описаниями в подписях, что дало ей возможность фиксировать самые тонкие нюансы.
Кроме того, в целях безопасности каждое изображение, созданное Imagen 3, будет содержать встроенный цифровой водяной знак, делающий невозможным его незаконное использование.
В ближайшие месяцы Imagen 3 появится в общедоступной предварительной версии, а в данный момент модель доступна для избранных авторов в сервисе ImageFX и вскоре будет представлена корпоративным клиентам компании.