В комментариях к статье про непростой вопрос мы разговорились с Евгенией, и я пообещал ей рассказать, как делаются всякие ужасы, которыми я иллюстрирую свои публикации. С удовольствием выполняю.
В который уже раз хочу поблагодарить вас, дорогие читатели, за то, что темы для статей рождаются благодаря вам, вашим вопросам и комментариям. Огромное вам спасибо за возможность самовыражения. А если это будет полезно для вас - то это вообще прекрасно.
Итак, начнём с нейросети, к которой у меня вообще нет вопросов, одни благодарности - это продукт Сбера по фамилии Kandinsky, версия на данный момент - 2.1. Раньше она, если мне не изменяет память, называлась ruDALL-E, и, как и все проекты на начальных стадиях развития, не впечатляла результатами - например, вот к этой моей статье иллюстрации сделаны именно при помощи той самой, начальной версии. Я, кстати, решил тогда, что лучше буду искать картинки среди готового материала, чем обращаться к подобным сырым технологиям.
Технология больше не сырая, просохла, похоже))
Мэтр Кандинский 2.1 понимает запросы на сотне языков - большинство его коллег по нейросетевому цеху работают преимущественно на английском (знаю многих людей, которые принципиально считают английский единственным языком, на котором должны говорить профессионалы - иногда это бывает смешно). Для работы с данной нейросетью не нужно ничего устанавливать на компьютер или телефон - браузер есть на любом устройстве, а телеграм либо есть почти у всех, либо проблем с установкой не будет. У меня телеграм используется как средство проведения уроков, например. Звук - лучший из всех. Скайп и зум даже рядом не стояли.
Как начать работать? Есть несколько вариантов. Сегодня рассмотрим только один, для других будут другие статьи.
Телеграм-бот, который обладает несколько ограниченными возможностями, но всё равно прикольный.
В меню есть команда "включить профессиональный режим", но как его использовать, я пока не разобрался, ибо лень. Август посвящу не только прокачиванию в анализе данных, но и повышению эффективности работы с нейросетями.
Возвращаясь к ужастикам для иллюстраций. Нажимаем "Генерация по тексту", набираем и вводим запрос. После чего нам будет предложено выбрать стиль изображения - нажимаем соответствующую кнопку. Ждём-с. Недолго, секунд 15-20 максимум.
Да, если вдруг решите отправить запрос голосовым сообщением - увы, не получится. Это к Алисе Яндексовне (о её возможностях тоже поговорим как-нибудь).
Теперь о смешивании картинок поговорим. Тоже опция занятная. Нажимаем соответствующую кнопку, отправляем одно за другим два фото, и - вуаля!
Я попробовал смешать фото двух киногероев, о которых писал вот в этой статье. Получилось, конечно, странновато, не всем понравится. Но это не значит, что не стоит экспериментировать:
Идём дальше. Смешивание картинки и текста - что это? А вот что:
В результате вышло вот такое:
А "Вариации картинки" как понять? Насколько они могут быть вариативными? Давайте прямо вот предыдущий результат и прогоним через эту опцию:
Результат неоднозначный. Видно, что мэтр Кандинский 2.1 идёт в сторону упрощения и немного гиперболизации, причём ладно бы, если бы приукрашивал, так наоборот же:
Да, если вдруг пропали вот эти большие управляющие кнопки "Генерация по тексту", "Смешивание картинок" и так далее - нажмите кнопку "Меню" и выберите команду "Начать работу с ботом". И да, он может иногда подвисать (у меня было один или два раза), поэтому сам предлагает другие способы взаимодействия с нейросетью. Но о них мы в других статьях поговорим.
Кстати, на сайте возможности мэтра Кандинского проявляются и разворачиваются в полной мере, можно очень много чего делать с изображениями. Чего стоят одни только несколько десятков стилей оформления.
На сегодня позвольте прерваться.
Обнимаю.
Ваш Пал Саныч Рябчиков
P.S. Евгения, я считаю, что на Вашу просьбу я ответил где-то на одну десятую. Обязательно будут ещё статьи, будем развлекаться масштабно))