Найти в Дзене

Объяснение: Как создавать изображения с помощью Google Nano Banana или Gemini Flash 2.5

Оглавление

Введение

Определение фотографий быстро меняется, поскольку все больше компаний запускают инструменты искусственного интеллекта, которые переопределяют, как создаются изображения на каждом этапе процесса фотографии, будь то композиция или редактирование. Можно ли считать восстановление старой фотографии с помощью улучшения деталей и добавления цвета при помощи AI фотографией? Тем не менее, это не останавливает никого от использования искусственного интеллекта.

Тренд "Nano Banana"

Посмотрите на волну популярности "Nano Banana", которая захватила Интернет. Пользователи сети размещают увеличенные версии самих себя на прозрачном акриловом основании рядом с компьютером. Это лишь небольшая часть возможностей нового AI-модела Google под названием Gemini Flash 2.5 Image, ранее известного как Nano Banana. Вам не нужно тратить тысячи рублей, чтобы изучить возможности этого инструмента. Вот в чем прелесть AI.

Промпт: Превратите кота в персонажа видеоигры 16-бит

Новая модель генерации и редактирования изображений Google DeepMind доступна в приложении Gemini. Она позволяет преобразовывать вашего питомца в миниатюрную фигурку или персонажа видеоигры. Google утверждает, что вы можете устроить чаепитие с вашим юным я.

Создание изображений

Преимущество модели заключается в том, что образ человека или животного остается неизменным во всех редактированиях; легче изменять части изображения, сохраняя остальное неизменным, и применять стиль от одного объекта к другому. Подумайте о множестве фотографий, которые лежат у вас в шкафу, будь то фотографии бабушек и дедушек или родителей. Некоторые из них размыты. Исправление этих изображений требует лишь наличие аккаунта Google.

Популярность Gemini

Несколько дней назад Джош Вудворд, вице-президент Google Labs и Gemini, сообщил, что с момента выхода новой модели люди создали более 200 миллионов изображений с использованием AI, и более 10 миллионов человек подписались на приложение Gemini. Это вся игра: заставить людей зарегистрироваться, а затем, когда они привыкнут, перейти на платный уровень.

Редактирование изображений

Обновленный Gemini часто предоставляет отредактированные изображения менее чем за 30 секунд, в то время как ChatGPT 5 от OpenAI иногда требует более чем в три раза больше времени для обработки тех же запросов. Промпт, который используется для создания уменьшенной версии друзей, звучит так: "Создайте фигурку в масштабе 1/7 персонажа на фото. Стиль должен быть реалистичным, с четко определенными чертами, и размещен в реальной обстановке. Фигурка должна находиться на офисном столе [можно импровизировать], стоя на круглой прозрачной акриловой основе без текста. На экране компьютера должно отображаться моделирование этой фигурки в Adobe Illustrator [можно импровизировать]. Рядом с экраном разместите упаковку игрушки в стиле Кена [можно импровизировать], распечатанную с оригинальным фото].

Далее, выберите фото с вашего компьютера в Интернете, щелкните правой кнопкой и скопируйте. Вставьте его с вышеуказанным промптом. Нажмите Enter.

Через 30 секунд изображение будет создано, которое вы можете скачать и поделиться в социальных сетях. Все очень просто. Даже если вы используете бесплатную версию Gemini, это работает.

Трудности при использовании AI

Модель может не всегда срабатывать, так как лица людей могут выглядеть немного синтетически, как будто их обрабатывали фотошопом. Возможно, это делается намеренно, чтобы изображения имели ощущение AI. Пропустите старую фотографию через Gemini. Попросите ее раскрасить и затем прояснить размытую фотографию. Не все версии будут идеальными, но порой вы найдете что-то, что близко к оригиналу.

Новые возможности врача

Существует способ превратить фотографии ингредиентов в десерт. Промпт: "Преобразуйте эти ингредиенты в изысканный, аппетитный десерт, вдохновленный этими ингредиентами. Подавайте так, как если бы это было блюдо в ресторане 5-звездочного уровня."

Как распознать использование AI

С каждым днем становится все труднее отделить фотографии, созданные AI, от настоящих, поскольку мы видим их в социальных сетях всего на секунду-другую. Модель Google оставляет определенные элементы неповрежденными в фотографиях, что может указывать на использование AI. Также есть небольшой индикатор в нижнем правом углу, чтобы обозначить вклад AI, но его легко обрезать.

Водяные знаки и идентификация AI

Кроме того, изображения, отредактированные с помощью новой модели Gemini, имеют встроенные специальные водяные знаки "SynthID", которые могут использоваться для выделения конкретных манипуляций с AI. В то же время Google заявил в прошлом году: "SynthID не является серебряной пулей для идентификации контента, созданного AI, но это важный строительный блок для разработки более надежных инструментов идентификации AI и может помочь миллионам людей принимать обоснованные решения о том, как им взаимодействовать с контентом, созданным AI."

Тренды и будущие перспективы

В январе 2024 года Патрик Шомет, EVP Samsung по опыту клиентов, сказал TechRadar: "На самом деле не существует такого понятия, как настоящая фотография. Как только у вас есть сенсоры для захвата чего-то, вы воспроизводите то, что видите, и это ничего не значит. Нет настоящей фотографии, точка."

Тем не менее, Google Pixel Camera имеет несколько трюков AI. Айзек Рейнольдс, менеджер группы продуктов для Pixel Camera, упомянул в Wired в августе 2024 года, что команда Pixel сосредоточена на "воспоминаниях": "Это о том, что вы помните...."

Попробуйте эти промпты с Gemini Flash 2.5

  • "Вот мое фото как взрослого. Создайте фото меня как взрослого, сидящего с собой в детстве в игровой комнате, где мы устраиваем чаепитие вместе."
  • "Преобразуйте это фото в карту стилизованного 3D мира для фэнтези-игры. Включите деревню и порт."
  • "Преобразуйте эти ножницы в реалистично выглядящего фэнтези-персонажа в фильме о эльфах и феях."
  • "Создайте захватывающую 9-серийную историю с 9 изображениями с этими двумя протагонистами и их приключениями как секретных супергероев. История захватывающая на протяжении всего рассказа с эмоциональными подъемами и падениями, с неожиданным поворотом и завершающим аккордом. Не включайте никаких слов или текста на изображениях, а просто расскажите историю через саму визуализацию."
  • "Преобразуйте этот дом в яркий тропический островной дизайн. Замените крышу на соломенную и добавьте бамбуковые элементы конструкции. Окружите его пышной, красочной тропической растительностью и пальмами."

==> Хотите узнать про автоматизации на n8n? — Здесь основные курсы n8n, вы научитесь автоматизировать бизнес-процессы! <==

-2