Компания Google объявила о возобновлении функции генерации изображений людей в своей модели Imagen 3. Это решение последовало после временной приостановки данной возможности в начале лета из-за неоднозначной реакции пользователей на первоначальные результаты работы системы.
Обновленная версия Imagen 3, интегрированная в платформу Gemini, обещает существенные улучшения в качестве и точности генерируемых изображений. Разработчики уверяют, что новая итерация ИИ-модели способна более адекватно интерпретировать текстовые запросы пользователей, создавая соответствующий визуальный контент.
Однако возобновление работы функции генерации изображений людей не обошлось без сюрпризов и теперь имеет ряд новых ограничений. В частности, система не будет создавать фотореалистичные портреты известных личностей, включая политиков и знаменитостей. Кроме того, введен запрет на генерацию изображений с чрезмерным насилием, жестокостью или сексуальным подтекстом.
Предыдущая версия Imagen 3 столкнулась с критикой из-за чрезмерного стремления к разнообразию в генерируемых изображениях. Пользователи отмечали, что даже при запросах, предполагающих изображение людей со светлой кожей, система часто создавала портреты темнокожих индивидов или женщин, что не соответствовало историческому контексту или специфике запроса.
Показательным примером стал случай с генерацией изображения американского сенатора 19 века. Изначально система создавала нерелевантные портреты, но после доработки теперь корректно изображает пожилых белых мужчин (см. верхнее изображение), что соответствует исторической действительности того периода.
Новая версия Imagen 3 будет внедряться поэтапно, начиная с платных пользователей сервисов Gemini Advanced, Business и Enterprise. Для широкой аудитории Google предоставляет возможность тестирования обновленной модели в лаборатории AI Labs.
Важно отметить, что Google продолжает придерживаться своих основных принципов в разработке искусственного интеллекта. Все генерируемые изображения маркируются водяными знаками с использованием технологии SynthID, что позволяет отличить созданный ИИ контент от реальных фотографий.
Развитие технологий генерации изображений с помощью ИИ вызывает обоснованные опасения в обществе. Многие эксперты предупреждают о потенциальном росте дезинформации и манипуляций с визуальным контентом. Однако на текущем этапе даже самые продвинутые системы ИИ все еще создают изображения, которые можно отличить от реальных фотографий при внимательном рассмотрении.
Тем не менее, скорость развития технологий впечатляет. Быстрое обновление Imagen 3 демонстрирует, насколько стремительно совершенствуются алгоритмы генерации изображений. Это заставляет задуматься о том, что сценарии, которые сегодня кажутся фантастическими, могут стать реальностью в ближайшем будущем.
В заключение стоит отметить, что развитие технологий генеративного ИИ ставит перед обществом серьезные этические и практические вопросы. Необходимо найти баланс между инновациями и потенциальными рисками, чтобы максимизировать пользу от новых технологий, минимизируя при этом возможные негативные последствия их применения.