Несколько недель, как началось моё знакомство с графической нейросетью Kandinsky 2.1
Надо сказать, что поводом написать статью (и вообще начать писать статьи) стал скандал связанный с Сергеем Мироновым и нейросетью, который освещал у себя на канале Женя Баженов (BadComedian), но обо-всём по порядку.
Всё началось с того что у одного из товарищей в Телеграмме нашёл его "нейро-творчество" и тоже решил поэкспериментировать через телеграмм-бот.
Для тех кто ещё не сталкивался немного расскажу о функционале.
Есть 4 режима работы:
- Генерация по тексту - пишем некоторый текст, и выбираем один из 4 стилей: "artstation", "4k", "anime" и "без стиля". Я особенно не вдавался в подробности стилей, и в основном обходился "без стиля".
- Смешивание картинок - загружаем две картинки или фото одна за другой, и получаем некоторую их компиляцию.
- Смешивание картинки и текста - пожалуй из названия понятно что к чему.
- Вариации картинки - загружаем картинку, и нейронка выдаёт нам случайную фантазию на тему загруженного.
И так... первым моим запросом стала генерация по тексту моих имени и фамилии. Получился такой суровый господин, похожий то ли на помора с обветренным от северных морей лицом, то ли на бурлака с пустым от безнадеги взглядом. В целом если учесть что у меня голубые глаза и я ношу бороду - можно поставить твёрдую четверку.
Так нейросеть поняла запрос: "Боец российского спецназа в образе викинга". Вот они страсти юного милитариста...
Уже тогда я заподозрил неладное, и слегка отредактировал запрос: "Спецназовец с автоматом в образе викинга". И это уже было больше похоже на то чего я добивался. Думаю что вы тоже заметили что ключ крылся в слове "российского".
Качество генерация оставляет желать лучшего, на лицо "детские болезни" Midjourney, полная неразбериха с конечностями и их количеством, однако стилистика в целом выдержанная, хотя эти спецназовцы и похожи больше на членов команды "Летучего голландца".
Спецназовцы-викинги пожалуй тоже сойдут на четверку, однако РУССКИЕ спецназовцы-викинги: неуд.
Запрещёнка
Вспомнив что у Midjourney были ограничения различного характера, я решил проверить Kandinskого на предмет блокировок N+.
Оказалось что поклонники знаменитого абстракциониста, уважают топлес, особенно: "Русская красавица топлес".
Потому что например, "Японская гейша топлес" уже не столь великолепна, хотя возможно нужно быть истинным самураем что бы оценить их загадочную красоту:
Покопавшись в своих подростковых фантазиях, решил узнать как бы выглядели: "Норвежские спортсменки в снегу топлес". И тут я понял что мои подозрения вызванные словом "российский" в генерации спецназовцев-викингов были напрасны. Очевидно же что Kandinsky 2.1, верный своему отечеству патриот, и грезит только русскими красавицами в снегу.
Для дела
Спустя пару дней после первых изысканий, мне понадобилось оформить телеграмм-группу для моих будущих музыкантов и я вспомнил про Кандинского. Поскольку гитаристы наши будут не просто музыкантами, но исполнителями киртанов, бхаджанов и духовных стихов, нужно было вдохновлять их какой то более одухотворенной картиночкой чем:
В ход пошла уже проверенная текстовая генерация буддистского монаха с немного кривой электрогитарой.
Весьма достойно, опуская количество и размеры пальцев. Хотелось сделать обложку более узнаваемой, решил опробовать Смешивание Картинок, что бы сделать Далай-Ламу с гитарой, но почему-то Kandinsky Далай-Ламу не котирует как бы я не старался:
Результат:
Всякий раз получались только абстрактные криворукие исполнители лютневой музыки 19-го века, даже если я обрезал верх у затравочного фото с гитаристом... Так что пришлось остановиться на первом варианте.
Вы уже побаловались с Kandincky 2.1? И как оно? (ответь в комментариях)
Продолжение в следующей части статьи Kandinsky в кроссовках Part 2
Подпишись что бы получать в подарок Новые Кроссовки!