Исследовательское подразделение Google Labs презентовало Whisk — новый сервис для генерации изображений. Его отличительной чертой стала возможность создания картинок без их текстового описания. Вместо этого нейросети нужно «скормить» референсные изображения в качестве примера. Для использования Google Whisk необходимо загрузить изображение ключевого объекта. Затем нейросети нужно «скормить» вторую картинку, от которой будет зависеть стиль. Дополнительно можно уточнить, что именно вы хотите получить или как отредактировать изображение. «Под капотом» Whisk — комбинация из нейросетей Gemini и новой Imagen 3. Первая анализирует загруженные изображения и создаёт их текстовое описание, которое передаётся в Imagen 3 с учётом всех пожеланий пользователя, чтобы создать нужную картинку. «Поскольку Whisk извлекает из вашего изображения только несколько ключевых характеристик, он может генерировать изображения, которые отличаются от ваших ожиданий. Например, сгенерированный объект может иметь друг
Новая нейросеть Google Whisk генерирует картинки без текстового описания
17 декабря 202417 дек 2024
88
1 мин