Добавить в корзинуПозвонить
Найти в Дзене
4pda.to

Gemini научился искусно редактировать картинки. Пять необычных примеров

Google открыла предварительный доступ к функции генерации изображений в модели Gemini 2.0 Flash. Оказалось, что нейросеть можно использовать для реставрации фотографий, создания 3D-моделей и других интересных штук. Gemini 2.0 Flash способна восстанавливать детали на старых фотографиях, а в случае с чёрно-белым форматом — ещё и раскрашивать. Чат-бот позволяет скорректировать результат: например, подскажет, что цвет какого-то объекта на самом деле другой. Если приглядеться, заметны типичные для ИИ артефакты вроде смазанных лиц и нечётких мелких объектов. Но в целом результаты неплохие. Нейросеть способна взять любой снимок человека и сделать фото на паспорт. Алгоритму удаётся захватить черты лица, причём даже если объект изображён вполоборота. Владельцы фотосалонов напряглись? Находчивые пользователи обнаружили, что Gemini 2.0 Flash неплохо справляется с удалением водяных знаков с изображений. Зачастую нейромодели отказываются стирать вотермарки, чтобы не нарушать авторские права. Однако
Оглавление
   Gemini научился искусно редактировать картинки. Пять необычных примеров
Gemini научился искусно редактировать картинки. Пять необычных примеров

Google открыла предварительный доступ к функции генерации изображений в модели Gemini 2.0 Flash. Оказалось, что нейросеть можно использовать для реставрации фотографий, создания 3D-моделей и других интересных штук.

-2

Реставрация и раскрашивание чёрно-белых фотографий

Gemini 2.0 Flash способна восстанавливать детали на старых фотографиях, а в случае с чёрно-белым форматом — ещё и раскрашивать. Чат-бот позволяет скорректировать результат: например, подскажет, что цвет какого-то объекта на самом деле другой.

-3

Если приглядеться, заметны типичные для ИИ артефакты вроде смазанных лиц и нечётких мелких объектов. Но в целом результаты неплохие.

Портретные фото из обычных

Нейросеть способна взять любой снимок человека и сделать фото на паспорт. Алгоритму удаётся захватить черты лица, причём даже если объект изображён вполоборота. Владельцы фотосалонов напряглись?

-4

Удаление водяных знаков

Находчивые пользователи обнаружили, что Gemini 2.0 Flash неплохо справляется с удалением водяных знаков с изображений. Зачастую нейромодели отказываются стирать вотермарки, чтобы не нарушать авторские права. Однако у ИИ от Google такого ограничения нет.

-5

Правда, Gemini оставляет на картинках собственную отметку. Она находится в углу, но маленький значок в большинстве случаев нетрудно убрать встроенными средствами любого фоторедактора.

Дизайн интерьеров

Обычно для создания прототипов интерьеров используют специальный софт. Но Gemini 2.0 Flash можно «скормить» фотографию помещения, попросить убрать все предметы и придумать новое расположение мебели в заданном стиле.

-6

Игровые персонажи

Ещё один креативный способ использования новых возможностей Gemini — создание игровых персонажей. Можно загрузить любую фотографию и попросить ИИ сделать из неё 3D-объект для игры. Нейросеть даже способна изобразить сеттинг, а дополнительными запросами нетрудно сгенерировать несколько кадров и склеить из них анимацию.

-7

Как воспользоваться

Экспериментальные опции ИИ доступны на платформе Google AI Studio. Платить за генерацию не придётся.

В России сервис не активен. Для работы придётся подменить IP-адрес или включить альтернативный DNS-сервер, например dns.comss.one. Конкретная инструкция зависит от операционной системы. Так, на Android изменение стандартного DNS-провайдера доступно в дополнительных настройках сети:

  • На Pixel: «Настройки» → «Сеть и интернет» → «Частный DNS-сервер».
  • На Samsung: «Настройки» → «Подключения» → «Другие настройки» → «Персональный DNS-сервер».
  • На Xiaomi: «Настройки» → «Подключения и общий доступ» → «Частный DNS-сервер».
-8

Google умеет отслеживать регион по cookie-файлам и другим признакам. Если попасть в AI Studio не получается, стоит воспользоваться режимом «Инкогнито» в браузере.

После входа на платформу примите пользовательское соглашение. Настройки модели находятся в меню справа. В пункте Model выберите Gemini 2.0 Flash (Image Generation) Experimental. Поле ввода запроса расположено в нижней части страницы, а за кнопкой + скрыта возможность загрузить своё изображение — например, чтобы попросить нейросеть его отредактировать.