Найти тему
Павел Рябчиков

Нейросети для... Нет, не для репетитора. Для всех)) Часть #1

В комментариях к статье про непростой вопрос мы разговорились с Евгенией, и я пообещал ей рассказать, как делаются всякие ужасы, которыми я иллюстрирую свои публикации. С удовольствием выполняю.

В который уже раз хочу поблагодарить вас, дорогие читатели, за то, что темы для статей рождаются благодаря вам, вашим вопросам и комментариям. Огромное вам спасибо за возможность самовыражения. А если это будет полезно для вас - то это вообще прекрасно.

Итак, начнём с нейросети, к которой у меня вообще нет вопросов, одни благодарности - это продукт Сбера по фамилии Kandinsky, версия на данный момент - 2.1. Раньше она, если мне не изменяет память, называлась ruDALL-E, и, как и все проекты на начальных стадиях развития, не впечатляла результатами - например, вот к этой моей статье иллюстрации сделаны именно при помощи той самой, начальной версии. Я, кстати, решил тогда, что лучше буду искать картинки среди готового материала, чем обращаться к подобным сырым технологиям.

Технология больше не сырая, просохла, похоже))
Результат генерации по запросу "Нейросеть Kandinsky 2.1 принимает поздравления от довольных пользователей и от онлайн-репетитора Рябчикова Пал Саныча лично", стиль: 4k
Результат генерации по запросу "Нейросеть Kandinsky 2.1 принимает поздравления от довольных пользователей и от онлайн-репетитора Рябчикова Пал Саныча лично", стиль: 4k

Мэтр Кандинский 2.1 понимает запросы на сотне языков - большинство его коллег по нейросетевому цеху работают преимущественно на английском (знаю многих людей, которые принципиально считают английский единственным языком, на котором должны говорить профессионалы - иногда это бывает смешно). Для работы с данной нейросетью не нужно ничего устанавливать на компьютер или телефон - браузер есть на любом устройстве, а телеграм либо есть почти у всех, либо проблем с установкой не будет. У меня телеграм используется как средство проведения уроков, например. Звук - лучший из всех. Скайп и зум даже рядом не стояли.

Как начать работать? Есть несколько вариантов. Сегодня рассмотрим только один, для других будут другие статьи.

Телеграм-бот, который обладает несколько ограниченными возможностями, но всё равно прикольный.

Четыре основных операции, выбор стилей невелик, тоже всего четыре штуки. Для оформления блога Дзен - более чем достаточно
Четыре основных операции, выбор стилей невелик, тоже всего четыре штуки. Для оформления блога Дзен - более чем достаточно

В меню есть команда "включить профессиональный режим", но как его использовать, я пока не разобрался, ибо лень. Август посвящу не только прокачиванию в анализе данных, но и повышению эффективности работы с нейросетями.

Возвращаясь к ужастикам для иллюстраций. Нажимаем "Генерация по тексту", набираем и вводим запрос. После чего нам будет предложено выбрать стиль изображения - нажимаем соответствующую кнопку. Ждём-с. Недолго, секунд 15-20 максимум.

Да, мне иногда не хватает РосОбрКотоНадзора рядом с клавиатурой. Со временем пройдёт.
Да, мне иногда не хватает РосОбрКотоНадзора рядом с клавиатурой. Со временем пройдёт.

Да, если вдруг решите отправить запрос голосовым сообщением - увы, не получится. Это к Алисе Яндексовне (о её возможностях тоже поговорим как-нибудь).

Теперь о смешивании картинок поговорим. Тоже опция занятная. Нажимаем соответствующую кнопку, отправляем одно за другим два фото, и - вуаля!

Персонажи, думаю, знакомы всем
Персонажи, думаю, знакомы всем

Я попробовал смешать фото двух киногероев, о которых писал вот в этой статье. Получилось, конечно, странновато, не всем понравится. Но это не значит, что не стоит экспериментировать:

И повзрослевший Коля, и Данила побили бы меня за такое творчество. Хотя вполне достоверный пацан получился.
И повзрослевший Коля, и Данила побили бы меня за такое творчество. Хотя вполне достоверный пацан получился.

Идём дальше. Смешивание картинки и текста - что это? А вот что:

В общем-то, картинка и текст об одном и том же
В общем-то, картинка и текст об одном и том же

В результате вышло вот такое:

Результат смешивания картинки и текста "Данила Багров возвращается в Москву на самолёте из США"
Результат смешивания картинки и текста "Данила Багров возвращается в Москву на самолёте из США"

А "Вариации картинки" как понять? Насколько они могут быть вариативными? Давайте прямо вот предыдущий результат и прогоним через эту опцию:

-8

Результат неоднозначный. Видно, что мэтр Кандинский 2.1 идёт в сторону упрощения и немного гиперболизации, причём ладно бы, если бы приукрашивал, так наоборот же:

Не очень. Но опция вполне достойная, будем использовать. Нет, не для уродования, а чтобы с разных сторон на ситуацию посмотреть
Не очень. Но опция вполне достойная, будем использовать. Нет, не для уродования, а чтобы с разных сторон на ситуацию посмотреть

Да, если вдруг пропали вот эти большие управляющие кнопки "Генерация по тексту", "Смешивание картинок" и так далее - нажмите кнопку "Меню" и выберите команду "Начать работу с ботом". И да, он может иногда подвисать (у меня было один или два раза), поэтому сам предлагает другие способы взаимодействия с нейросетью. Но о них мы в других статьях поговорим.

Кстати, на сайте возможности мэтра Кандинского проявляются и разворачиваются в полной мере, можно очень много чего делать с изображениями. Чего стоят одни только несколько десятков стилей оформления.

На сегодня позвольте прерваться.

Обнимаю.

Ваш Пал Саныч Рябчиков

P.S. Евгения, я считаю, что на Вашу просьбу я ответил где-то на одну десятую. Обязательно будут ещё статьи, будем развлекаться масштабно))