Добавить в корзинуПозвонить
Найти в Дзене
КОНТЕКСТ РЕШАЕТ

Эксперименты: делаем стоковые фото для сайта с помощью нейросетей

Сегодня мы хотели бы рассказать о возможности использования нейросети для преобразования готовых изображений в текст, а затем измиенение этого запроса-текста и создание своего изображения с помощью другой нейросети, которое будет уникально и его можно использовать для своих проектов. А также попробуем сами на нескольких картинках, как будет получаться у нас. Такой текст называется промт Промт может включать в себя различные элементы, которые помогают модели работать более эффективно. Логика работы проста Таким образом, вы получаете финальный результат, похожий на оригинал. Это может быть полезно, если картинка полностью соответствует вашим требованиям, но она имеет авторские права и не может быть использована в коммерческих целях. С помощью этого помощника, вы сможете обойти эти ограничения! В дальнейшем можно дополнять промпт и пытаться улучшить изображение до нужного результата. Хотя текущие нейросети почти всгда "забывают", о чем была речь ранее и генерят новую картинку. поп
Оглавление

Сегодня мы хотели бы рассказать о возможности использования нейросети для преобразования готовых изображений в текст, а затем измиенение этого запроса-текста и создание своего изображения с помощью другой нейросети, которое будет уникально и его можно использовать для своих проектов.

А также попробуем сами на нескольких картинках, как будет получаться у нас.

Такой текст называется промт

Промт может включать в себя различные элементы, которые помогают модели работать более эффективно.

  • Например, инструкция — это условие или задача, которую модель должна выполнить
  • Контекст — это дополнительная информация от пользователя, которая может помочь модели
  • Входные данные — это вопрос, ответ на который модель должна выдать. Индикатор вывода - это формат, в котором модель должна выдать свой ответ

Логика работы проста

  1. Вы загружаете понравившуюся картинку в нейросеть, которая выдаст промт (image-to-prompt) по ней
  2. Затем, вы модифицуруете промпт (обучно добавляя фотореалистично или как на фотостоке) вставляете получившийся текст в другую нейросеть, которая генерирует изображения Kandinski Bing Designer Midjorney

Таким образом, вы получаете финальный результат, похожий на оригинал.

Это может быть полезно, если картинка полностью соответствует вашим требованиям, но она имеет авторские права и не может быть использована в коммерческих целях. С помощью этого помощника, вы сможете обойти эти ограничения!

В дальнейшем можно дополнять промпт и пытаться улучшить изображение до нужного результата. Хотя текущие нейросети почти всгда "забывают", о чем была речь ранее и генерят новую картинку.

попробуем КАК это работает

Случай №1. Котик. Все любят котиков.

Оригинал фотографии кота мы скачали из интернет, поэтому изменим его (красные линии и красный текст), чтобы нас не привлекли правообладатели.

-2

1. Незамедлительно залетаем на сайт преобразования картинки в промпт (image-to-prompt)

2. Через 2-3 минуты получаем такой промпт: "a black and white cat sitting on top of a wooden table, shutterstock, realism, an indifferent face, sitting on a wooden dock, with a white nose, toxic cat"

— Токсик кэт?! Вот даже в нюансы умеют нейросетки - кот на нас пялится с выражением "как на ..вно" поэтому видимо токсик ;)

3. Чутка дополняем промпт словом photorealistic (используем английский язык, если не владеем -- то прыг сюда) и в Bing Designer генерируем это:

— Почти то что нужно! Но кот не лежит как на оригинале! Дополняем промпт:

the cat should be lying down, the cat's back should be out of focus (кот должен лежать, спина кота быть в расфокусе)

4. Получаем такие варианты:

Ну вот — другое дело!

Случай №2. Строитель для сайта

Попробуем более полезный вариант — создадим картинку для иллюстрации сайта строителей.

1. Оригинальная картинка (также ее изменили порисовав красным)

-5

1.  Переходим на сайт преобразования картинки в промпт (image-to-prompt)

2. Через некоторое время получаем такой промпт: "a man in a hard hat sitting at a table, shutterstock, instructions to build it, smiling male, gambrel roof building, 30 year old man"

мужчина в каске сидит за столом, shutterstock, инструкции по строительству, улыбающийся мужчина, строительство двускатной крыши, мужчина 30 лет

3. Дополняем промпт словом photorealistic like a stock photo и в Bing Designer генерируем это:

Недурно! Но немного не то. Попробуем дополнить промпт:  "Use a european face of a man without a beard, and the background should be a gray plastered wall, as well as a construction gray streman and part of an assembled white cabinet"

Используйте европейское лицо мужчины без бороды, а фоном должна быть серая оштукатуренная стена, а также строительный серый стремянка и часть собранного белого шкафа

4. Получаем следующие варианты:

Мощно! Брутальность зашкаливает. Хотя про бороду облом — видимо нейросетку учили, что 30+ лет и строитель — это борода онли. Ну да ладно.

5. Попробуем еще чутка в дополнение диалога с нейросеткой написать следующее: "Use the third option, but add more light to the room and pencil and paper to the builder's hands and it's more photorealistic"

Используй третий вариант, но добавь больше света в комнату и карандаш и бумагу в руки строителя, и более фотореалистично.

Получаем такие варианты (опять +- то же самое)

В принципе, хорошие варианты. Хотя оригинала мы не добились.

Но видимо, нужно пробовать самому подробно описывать картинку, а не лениться с помощью распознавающей сетки ;)

Но в любом случае, комбинируя различные нейросети, вы получаете мощные инструменты для творчества, которые помогут вам выйти на новый уровень в бизнесе!