Добавить в корзинуПозвонить
Найти в Дзене
4pda.to

Новая нейросеть Google Whisk генерирует картинки без текстового описания

Исследовательское подразделение Google Labs презентовало Whisk — новый сервис для генерации изображений. Его отличительной чертой стала возможность создания картинок без их текстового описания. Вместо этого нейросети нужно «скормить» референсные изображения в качестве примера. Для использования Google Whisk необходимо загрузить изображение ключевого объекта. Затем нейросети нужно «скормить» вторую картинку, от которой будет зависеть стиль. Дополнительно можно уточнить, что именно вы хотите получить или как отредактировать изображение. «Под капотом» Whisk — комбинация из нейросетей Gemini и новой Imagen 3. Первая анализирует загруженные изображения и создаёт их текстовое описание, которое передаётся в Imagen 3 с учётом всех пожеланий пользователя, чтобы создать нужную картинку. «Поскольку Whisk извлекает из вашего изображения только несколько ключевых характеристик, он может генерировать изображения, которые отличаются от ваших ожиданий. Например, сгенерированный объект может иметь друг
   Новая нейросеть Google Whisk генерирует картинки без текстового описания
Новая нейросеть Google Whisk генерирует картинки без текстового описания

Исследовательское подразделение Google Labs презентовало Whisk — новый сервис для генерации изображений. Его отличительной чертой стала возможность создания картинок без их текстового описания. Вместо этого нейросети нужно «скормить» референсные изображения в качестве примера.

Для использования Google Whisk необходимо загрузить изображение ключевого объекта. Затем нейросети нужно «скормить» вторую картинку, от которой будет зависеть стиль. Дополнительно можно уточнить, что именно вы хотите получить или как отредактировать изображение.

«Под капотом» Whisk — комбинация из нейросетей Gemini и новой Imagen 3. Первая анализирует загруженные изображения и создаёт их текстовое описание, которое передаётся в Imagen 3 с учётом всех пожеланий пользователя, чтобы создать нужную картинку.

-2

«Поскольку Whisk извлекает из вашего изображения только несколько ключевых характеристик, он может генерировать изображения, которые отличаются от ваших ожиданий. Например, сгенерированный объект может иметь другой рост, вес, причёску или тон кожи. Мы понимаем, что эти характеристики могут быть решающими для вашего проекта, и Whisk может промахнуться, поэтому мы позволяем вам просматривать и редактировать базовые подсказки в любое время», — говорится в блоге Google.

На данный момент Google Whisk работает только в США.