Google стартовала в сфере искусственного интеллекта с некоторые сложностями. Инструменты компании стали причиной нескольких споров, особенно в связи с моделью для генерации изображений под названием Imagen. Тем не менее, компания продолжает двигаться вперед и представила свою новую модель Imagen 3.
Она была официально анонсирована во время Google I/O. Как и в случае с другими моделями генерации изображений, акцент здесь сделан на реалистичности, что делает его серьезным конкурентом DALL-E. В Imagen 3 пользователи могут ожидать более детализированных изображений с меньшим количеством артефактов, чем у предыдущей версии. Проблемы с искаженными формами, характерные для старых ИИ-изображений, больше не актуальны.
Одной из ключевых трудностей, с которыми сталкиваются разработчики изображений на основе ИИ, является создание текста. Часто попадаются картинки с некорректными надписями. Однако, Imagen 3 теперь предлагает значительно более качественную генерацию текста. Можно не беспокоиться о том, что тексты на изображениях будут искажены. Imagen 3 демонстрирует улучшенное понимание введенных подсказок. Это означает, что программа будет более точной в интерпретации запросов.
Что касается вопросов безопасности, Google приложил усилия для фильтрации потенциально опасного контента, чтобы минимизировать риск загрузки неподходящих изображений. Кроме того, у компании имеется инструмент для добавления водяных знаков, который помогает отличить искусственно созданные изображения от обычных.