708 подписчиков

Представь себя художником - немного первых опытов с ботом Kandinsky by SberAI

27 мая 202427 мая 2024

4 мин

При написании текстов, не связанных с объектами архитектуры или культуры, но написанных о людях - сразу же возникло желание добавить картинок - но каких? Ответ пришёл в голову сразу - реализованных генеративных AI ботов уже много, пользуйся, пробуй. Это не аналитическая статья - здесь не будет сравнений разных продуктов по скорости реакции, точности исполнения, актуальности и вариативности, стоимости и т.д. Это, скорее, результаты 2-х месяцев проб продукта, который устроил конечным результатом - но имеет как функциональные, так и сугубо эмоциональные особенности от опыта использования. Адрес тг бота: @kandinsky21_bot Правила пользования ботом Начиная использование телеграм-бота, вы соглашаетесь с Пользовательским соглашением и Политикой конфиденциальности Обращаем внимание, что текстовые запросы, а также графические объекты, которые вы создаёте в этом боте (далее по тексту – «Пользовательский контент»), не должны нарушать законодательство Российской Федерации, законодательство страны и

Оглавление

Генерация по тексту
Смешивание
Продолжение следует...

Это не аналитическая статья - здесь не будет сравнений разных продуктов по скорости реакции, точности исполнения, актуальности и вариативности, стоимости и т.д.

Это, скорее, результаты 2-х месяцев проб продукта, который устроил конечным результатом - но имеет как функциональные, так и сугубо эмоциональные особенности от опыта использования.

Адрес тг бота: @kandinsky21_bot

Правила пользования ботом Начиная использование телеграм-бота, вы соглашаетесь с Пользовательским соглашением и Политикой конфиденциальности Обращаем внимание, что текстовые запросы, а также графические объекты, которые вы создаёте в этом боте (далее по тексту – «Пользовательский контент»), не должны нарушать законодательство Российской Федерации, законодательство страны использования Платформы и общепризнанные этические правила и нормы. Вся ответственность за Пользовательский контент лежит на пользователе.

На конец мая 2024 доступны следующие возможности:

Генерация по тексту

Первой пробой пера была история с аллегорией к дятлу Вуду в номере с пожарной сигнализацией. В описании генератора сказано - как можно точнее опишите вашу картинку, во всех деталях. Ок, я просто вставил туда текст статьи, но, увы:

Запрос не должен превышать 1000 символов. Повторите запрос.

Я уменьшил объем текста, и ещё раз, и ещё раз. Наконец, нейросеть согласилась сгенерировать картинку по тексту, и получилась первая сгенерированная картинка, точнее, нечто, изображающее дятла Вуди, пульт от телевизора и телевизор:

Как мы гостя будили... без его желания Прекратить не получалось - пульт управления давал, конечно, нажимать на кнопки - но результата не было. Кнопки на телевизоре вели себя также. Большая красная кнопка питания призывно светила - выключи меня - но ехидно продолжала светиться дальше, немного намекая, что гость сходит с ума - или уже сошёл? В ушах звенел хохот дятла Вуди Вудпекера. Наконец, он пересилил себя и набрал номер ресепшн. "У меня проблемы с телевизором" - раздалось в трубке сквозь смех дятла, который продолжал насмехаться над гостем. ... Я в очередной раз понял, что добиваться надо решения всех нюансов в системе и её окружении - иначе однажды ночью, в самый неподходящий момент, тот самый дятел Вуди проснётся, выскочит из ниоткуда, разбудит своим клювом и будет насмехаться над Вашей беспомощностью.

Интересненько - подумал я - точно ли стоит продолжать? - ответ, конечно же - точно стоит!

Вторая картинка была не менее эксцентрична, и, кажется, достойна осмысления новых граней современного искусства. И, в целом, она согласуется с творчеством Василия Васильевича Кандинского (или нет?)

Следующие, наконец, получились получше, но были уж очень оторваны от реальности, с головой из головы и другими странностями. Но, наконец, нейросеть вроде смогла выдать что-то более-менее реальное и соответствующее запросу, что и попало в статью. Промежуточными перлами можно наслаждаться здесь:

Следующие картинки - с зарисовками в отеле - были, в целом, удачны, видимо нейросеть тренировалась на схожих объектах и с ходу выдавала неплохие результаты. Запрос был коротким:

Жена консула спит в отеле, а к ней в номер постоянно случайно заходят посторонние гости

Картинки не с людьми нейросетке удавались, явно, сложнее. В зарисовке про потоп в отеле из-за оставленных в ванне носков мне пришлось долго помучаться, чтобы получить нормальный результат - носки упорно стояли в раковине, и никак не хотели в ней плавать так, как полагается носкам.

Картинки же с выступлением перед залом удались нейросетке очень быстро и довольно безупречно. Запрос был:

Массовый найм, темный зал, в креслах в зале много народу, перед сценой три стола, за столами сидят жюри, на сцене стоит с микрофоном женщина в деловой юбке и белой блузке

Запрос про девушку на собеседовании сеть также отработала на ура. Да, были отклонения - недостаточно понятно или слишком откровенно - но почти все результаты были целевыми.

На собеседование пришла она и сидит напротив нога на ногу, молодая блондинка в сногсшибательном красном мини-платье, в деловом стиле, но на грани фола, на высоченных шпильках, её золотые кудри ниспадали на плечи, вид дополняли округлые очки в тоненькой золотой оправе

А вот после, при генерации изображений людей, сеть стала выдавать лютую дичь. Из голов что-то торчало. Лица были смяты и скомканы, либо откровенно обезображены. Пришлось повторять много раз запросы, чтобы получить изображения, которые не страшно увидеть во сне...

Смешивание

Очень хотелось не использовать известные картинки, а пофантазировать на тему альтернативного вида Зеленого из Тайны третьей планеты - но, на мой взгляд, результаты были слишком альтернативны, и я обратился к исходнику.

Альтернативный Зеленый из тайны третьей планеты

Но, смешивание сходу дало мне противоречивые результаты, и продолжать пользоваться я не стал. Что ожидалось - хочу наложить текст на картинку.

а я же предупреждал, что с этими ИТшниками добром дело не кончится

Что получилось - точно не этот результат, вот он, ниже (также. листайте вправо):

Получилась забавная и довольно-таки весёлая дичь, с абстрактными буковками, которые должны были отображать заданный текст. В Алисе Селезнёвой девочку нейросеть не распознала, возможно из-за причёски, и превратила в дядю с сомнительным выражением лица. Зелёный в целом не так уж и далёк от оригинала - но, в любом случае, нейросеть Kandinsky выполняет не то что хочется - и микс я делал просто вручную, по-старинке.

И, обратите внимание, на картинках есть кто-то третий. Мы что-то не замечаем на кадре из м/ф Тайны третьей планеты?

Представь себя художником - немного первых опытов с ботом Kandinsky by SberAI

Генерация по тексту

Смешивание

Продолжение следует...