Найти в Дзене
EnMørk

Помесь бульдога с носорогом - ещё опыты с нейросеткой Kandinsky by SberAI

Продолжая тематику знакомства с ботом Kandinsky by SberAI генеративной нейросети, разберу ещё несколько кейсов реализации в нём. Для своей первой зарисовки про увольнения, где я описал случаи из стройки и отелей, с примерами формата "надо или нет отвечать за свою команду", я делал запрос на генерацию картинок с людьми со стройки, и результат был весьма приемлем, пока... пока на некоторых из них не обнаружились лишние руки-ноги. Выглядит это, откровенно говоря, жутко, но только тогда, когда присматриваешься - следите за тем, что нейросеть вам наплодила и стоит ли это пускать в печать))) А вот с пальцами на руках, я полагаю, всё обстоит не так страшно, если их не пять, а шесть или больше. Во-первых, это реально может так быть. Во-вторых, если принять во внимание подход мультипликаторов, изображающих людей, то можно вспомнить, как они отрисовывают четырёх-палых, с одной простой целью - все персонажи вымышлены, не являются людьми, все совпадения случайны. Вот эта фишка Kandinsky иногда оче
Оглавление

Продолжая тематику знакомства с ботом Kandinsky by SberAI генеративной нейросети, разберу ещё несколько кейсов реализации в нём.

Лишние части тел

Для своей первой зарисовки про увольнения, где я описал случаи из стройки и отелей, с примерами формата "надо или нет отвечать за свою команду", я делал запрос на генерацию картинок с людьми со стройки, и результат был весьма приемлем, пока... пока на некоторых из них не обнаружились лишние руки-ноги. Выглядит это, откровенно говоря, жутко, но только тогда, когда присматриваешься - следите за тем, что нейросеть вам наплодила и стоит ли это пускать в печать)))

А вот с пальцами на руках, я полагаю, всё обстоит не так страшно, если их не пять, а шесть или больше. Во-первых, это реально может так быть. Во-вторых, если принять во внимание подход мультипликаторов, изображающих людей, то можно вспомнить, как они отрисовывают четырёх-палых, с одной простой целью - все персонажи вымышлены, не являются людьми, все совпадения случайны.

Внезапное нарушение правил

Вот эта фишка Kandinsky иногда очень даже раздражает. Понятно, когда вы формируете описание - и бот сходу его отклоняет, это не вызывает вопросов. Но вот когда вы сгенерировали при неизменном запросе уже несколько, а то и десяток картинок, а бот внезапно пишет:

 Запрос не соответствует правилам работы с инструментом /rules Если вы не согласны, что запрос нарушает этические правила, то можете сообщить об этом нам.
Запрос не соответствует правилам работы с инструментом /rules Если вы не согласны, что запрос нарушает этические правила, то можете сообщить об этом нам.

И что с этим делать? Приходится заново вставлять текст и генерировать. Это, конечно, не великая проблема, но, когда вы делаете генерацию в фоновом режиме, и она вместо планомерно формируемого результата, из которого можно выбрать, даёт сбой - это сразу сбивает процессы все. И, главное, непонятно - как так-то? Почему до этого в боте генерировалась картинка, а теперь текст тот же самый не устраивает его правила?

Автотранспорт

При генерации автотранспорта, была замечена интересная особенность - очень часто перед вами будут вполне близко адаптированные авто, но иногда попадаются такие вот экзотические решения. Они могут как позабавить, так и ужаснуть. Куда может поехать это фургон -угольник, или тракторист, вырвавший из трактора какую-то запчасть, известно одной лишь нейросетке :)

-4
-5
-6

Части тел

В начале я описал про лишние части тел, которые нейросетка дорисовывает людям. Создавая зарисовку про нападение около выставки, я попробовал описать задание так, чтобы нейросеть создала людей, на которых напали - и вследствие нападения они упали около машины. Я перебрал несколько десятков картинок, уточнял запросы, менял запросы - но, тщетно.

Вероятно, нейросетка воспринимает такой запрос как жестокость, и... нет, не отклоняет его, а генерирует непонятные конструкции, тела роботов и другие абстракции. Но, на мой взгляд, когда я просил нарисовать двух людей, лежащих на асфальте около машины - я представлял себе именно людей, нейросеть же с каждой следующей генерацией рисовала всё более и более жуткие картинки, которые становились более жестокими.

Абстракции

В попытке сгенерировать сложные картинки, на которых есть несколько разных объектов и они что-то делают, я получил крайне неоднозначный результат, в котором намешалось всё.

США в схватке с Россией, а рядом Ангела Меркель. Результат не для любой психики...

-9

При попытке генерации микшированных стилей получаются, конечно, помеси бульдога с носорогом. Но, когда из попы коня торчит его вторая голова - это становится особенно забавным.

-10
-11

Помесь кошки, лошадки и тюленя - эту идею мне подкинул очень дорогой мне человек, и получилось это... нечто... милое? Тогда же мне пришла в голову мысль - а как выглядит та самая помесь бульдога с носорогом? Думаете, что это нечто несуразное? О нет, с таким встретиться точно не захочешь - это существо с железными аргументами!!! :) Встретишь такого в подворотне - никаких мыслей о несуразности даже не возникнет.

Помесь бульдога с носорогом
Помесь бульдога с носорогом