При написании текстов, не связанных с объектами архитектуры или культуры, но написанных о людях - сразу же возникло желание добавить картинок - но каких? Ответ пришёл в голову сразу - реализованных генеративных AI ботов уже много, пользуйся, пробуй.
Это не аналитическая статья - здесь не будет сравнений разных продуктов по скорости реакции, точности исполнения, актуальности и вариативности, стоимости и т.д.
Это, скорее, результаты 2-х месяцев проб продукта, который устроил конечным результатом - но имеет как функциональные, так и сугубо эмоциональные особенности от опыта использования.
Адрес тг бота: @kandinsky21_bot
Правила пользования ботом Начиная использование телеграм-бота, вы соглашаетесь с Пользовательским соглашением и Политикой конфиденциальности Обращаем внимание, что текстовые запросы, а также графические объекты, которые вы создаёте в этом боте (далее по тексту – «Пользовательский контент»), не должны нарушать законодательство Российской Федерации, законодательство страны использования Платформы и общепризнанные этические правила и нормы. Вся ответственность за Пользовательский контент лежит на пользователе.
На конец мая 2024 доступны следующие возможности:
Генерация по тексту
Первой пробой пера была история с аллегорией к дятлу Вуду в номере с пожарной сигнализацией. В описании генератора сказано - как можно точнее опишите вашу картинку, во всех деталях. Ок, я просто вставил туда текст статьи, но, увы:
Я уменьшил объем текста, и ещё раз, и ещё раз. Наконец, нейросеть согласилась сгенерировать картинку по тексту, и получилась первая сгенерированная картинка, точнее, нечто, изображающее дятла Вуди, пульт от телевизора и телевизор:
Интересненько - подумал я - точно ли стоит продолжать? - ответ, конечно же - точно стоит!
Вторая картинка была не менее эксцентрична, и, кажется, достойна осмысления новых граней современного искусства. И, в целом, она согласуется с творчеством Василия Васильевича Кандинского (или нет?)
Следующие, наконец, получились получше, но были уж очень оторваны от реальности, с головой из головы и другими странностями. Но, наконец, нейросеть вроде смогла выдать что-то более-менее реальное и соответствующее запросу, что и попало в статью. Промежуточными перлами можно наслаждаться здесь:
Следующие картинки - с зарисовками в отеле - были, в целом, удачны, видимо нейросеть тренировалась на схожих объектах и с ходу выдавала неплохие результаты. Запрос был коротким:
Жена консула спит в отеле, а к ней в номер постоянно случайно заходят посторонние гости
Картинки не с людьми нейросетке удавались, явно, сложнее. В зарисовке про потоп в отеле из-за оставленных в ванне носков мне пришлось долго помучаться, чтобы получить нормальный результат - носки упорно стояли в раковине, и никак не хотели в ней плавать так, как полагается носкам.
Картинки же с выступлением перед залом удались нейросетке очень быстро и довольно безупречно. Запрос был:
Массовый найм, темный зал, в креслах в зале много народу, перед сценой три стола, за столами сидят жюри, на сцене стоит с микрофоном женщина в деловой юбке и белой блузке
Запрос про девушку на собеседовании сеть также отработала на ура. Да, были отклонения - недостаточно понятно или слишком откровенно - но почти все результаты были целевыми.
На собеседование пришла она и сидит напротив нога на ногу, молодая блондинка в сногсшибательном красном мини-платье, в деловом стиле, но на грани фола, на высоченных шпильках, её золотые кудри ниспадали на плечи, вид дополняли округлые очки в тоненькой золотой оправе
А вот после, при генерации изображений людей, сеть стала выдавать лютую дичь. Из голов что-то торчало. Лица были смяты и скомканы, либо откровенно обезображены. Пришлось повторять много раз запросы, чтобы получить изображения, которые не страшно увидеть во сне...
Смешивание
Очень хотелось не использовать известные картинки, а пофантазировать на тему альтернативного вида Зеленого из Тайны третьей планеты - но, на мой взгляд, результаты были слишком альтернативны, и я обратился к исходнику.
Но, смешивание сходу дало мне противоречивые результаты, и продолжать пользоваться я не стал. Что ожидалось - хочу наложить текст на картинку.
а я же предупреждал, что с этими ИТшниками добром дело не кончится
Что получилось - точно не этот результат, вот он, ниже (также. листайте вправо):
Получилась забавная и довольно-таки весёлая дичь, с абстрактными буковками, которые должны были отображать заданный текст. В Алисе Селезнёвой девочку нейросеть не распознала, возможно из-за причёски, и превратила в дядю с сомнительным выражением лица. Зелёный в целом не так уж и далёк от оригинала - но, в любом случае, нейросеть Kandinsky выполняет не то что хочется - и микс я делал просто вручную, по-старинке.
И, обратите внимание, на картинках есть кто-то третий. Мы что-то не замечаем на кадре из м/ф Тайны третьей планеты?