Решила я в новой версии Шедеврума попытаться изобразить Чебурашку. Памятуя, как это было сложно в старой версии, скопировала запрос и отправила его на генерацию. Однако меня ждало разочарование. Новая версия, как оказалось, ни в зуб ногой.
Но ведь был Чебурашка! Да, надо было исхитриться, чтобы его изобразить. Тем не менее, ИИ нейронки доставал из яндексовских закромов образ милого зверька неизвестного вида. Получилась эта картинка в ответ на запрос «Чебурашка дружочек что ты сел в уголочек» - отрывок из неканоничного куплета песни «Я играю на гармошке».
Теперь же, как корова языком слизнула. Новая версия на тот же самый запрос не может воспроизвести аналогичную картинку.
Только на первом изображении некая игрушка с характерными ушами, но это ни разу не Чебурашка. Оставшиеся три варианта - вообще мимо. Последующие попытки были аналогичны.
Ну, хорошо. Пишу в запросе весь куплет:
Чебурашка дружочек,
Что ты сел в уголочек,
Что ты ушки свои опустил?
Подними-ка свой носик,
Улыбнись хоть разочек,
Посмотри, как хорош этот мир.
На сей раз результаты немного больше похожи на Чебурашку, но это все равно не тот известный нам персонаж сказок Эдуарда Успенского и советских мультфильмов.
Делаю еще одну попытку. Составляю следующий запрос:
Чебурашка - милый двуногий коричневый зверек неизвестного вида со светлой круглой плоской мордочкой, большими глазами, маленькими бровями, треугольным носиком, маленьким ртом, огромными круглыми ушами и короткими лапками.
Опять не то. Добавляю в тот же запрос «зверек-игрушка». Листайте галерею.
Первый рисунок из галереи выше немного ближе к Чебурашке, но опять не то. Возникает вопрос, а где были разработаны якобы отечественные нейросети? Чтобы понять это, сделаю небольшое отступление и покажу, как изобразили Чебурашку Кандинский 2.2. и две иностранные нейросетки.
Забугорные нейросети в курсе, что существует такой персонаж, как Чебурашка, но изображают его обезьянкой. Позор Кандинскому! Он делает то же самое. Такое впечатление, что Kandinsky 2.2 от Сбера использует алгоритм Stable Diffusion. В основе Шедеврума, судя по всему, другой алгоритм, поскольку две русскоязычные нейросетки сильно отличаются друг от друга.
Теперь генерирую текст в Шедевруме по запросу: «Кто создал алгоритм нейросети Шедеврум?» Вот ответ нейросети:
Алгоритм Шедеврум был разработан в 2016 году группой ученых из Университета штата Огайо (США) под руководством профессора Ричарда О'Салливана. В состав группы входили также профессор Эван Барнс и доцент Ричард Стилвелл.
Алгоритм Шедеврум основан на использовании глубокого обучения и нейросетей для создания моделей, которые могут распознавать изображения и генерировать новые изображения. Он был разработан для решения задачи генерации изображений на основе текстовых описаний.
Шедеврум, конечно, понапишет. Нашлись два Ричарда О'Салливана - один актер, другой - доктор медицинских наук. Оба не подходят. Ученые из Огайо в поисковых системах не ищутся. Поэтому к достоверности информации нужно относиться без уверенности. Однако не я первая создавала запрос о том, где создан Шедеврум, и всем он отвечает, что в США. Так что нечего удивляться, что эта нейросеть не знает Чебурашку.
А как дело обстоит с генерированием текста в Шедевруме? Трижды отправляю один и тот же запрос: «Анекдот про Чебурашку, смешно».
Муж с женой в зоопарке.
Муж с женой в зоопарке
— Милый, смотри какой смешной зверек!
— Это не зверек, это — Чебурашка.
Шедеврум знает, что Чебурашка - зверёк. Ещё раз.
Чебурашка идет по лесу и видит, что на дереве висит объявление: «Кто-то потерял свои уши. Нашедшему просьба вернуть за вознаграждение».
Чебурашка подумал и решил написать: «Чебурашку видели в лесу».
К тому же, Шедеврум знает, что главная примета Чебурашки - это большие уши. Третий, контрольный, раз.
Чебурашка и Гена пришли в гости к Шапокляк.
Шапокляк им говорит:
- Давайте я вас чаем угощу.
Чебурашка и Гена:
- Нет, спасибо, мы уже пили чай с твоей крысой.
Неважно, что все анекдоты вовсе не смешные. Главное, что Шедеврум связал Чебурашку с Крокодилом Геной и старухой Шапокляк. Но в генерировании текстов задействован другой алгоритм. Кстати, последний анекдот из моего профиля исчез. Баг или кто-то пожаловался?
Можно ли обучить Шедеврум рисовать Чебурашку? С одной стороны, только если разработчики, разумеется, не изначальные, а от Яндекса, загрузят в базу данных изображения Чебурашки и пропишут, что это именно Чебурашка, а не непонятно кто. С другой - любая нейросеть обучаема. Пользователи могут своими запросами с описанием Чебурашки сгенерировать картинки, максимально похожие на этого персонажа.
Создаю новый запрос, включающий себя особенности первых двух промтов: «Чебурашка дружочек что ты сел в уголочек, темно-коричневый, двуногий, светлая мордочка, большие круглые темные глаза, треугольный носик, круглая голова, огромные круглые уши по бокам головы, кукольный мультфильм СССР». Но как объяснить Шедевруму, что Чебурашка - не мышь, не медведь, не обезьяна, если частицу «не» нейросети практически не воспринимают?
Проверяю, знает ли Шедеврум крокодила Гену и старуху Шапокляк. Ожидаемо, нейросеть не в курсе.
С добавлением описания персонажей можно получить более-менее внятные картинки.
А знает ли Шедеврум наше, русское? Балалайка, гармошка, гусли, лапти, шапка-ушанка, рубаха-косоворотка, матрешка, разные щи-борщи.
Как оказалось, далеко не всё. Нейросеть знает, что лапти - это обувь, но какая именно - не в курсе. Про балалайку Шедеврум знает, что это струнный музыкальный инструмент, а про гусли вовсе понятия не имеет. Гармошку нейросетка рисует неправильно, но ровно так же лажает при генерировании картинок с баяном и аккордеоном. Все три музыкальных инструмента из семейства гармоник получаются больше похожими на проект жилого комплекса.
Остальное - кое-что зачесть можно. Иное - с натягом. Убедитесь сами - листайте галерею.
В заключение галерея с изображениями других персонажей советских и иностранных мультфильмов. Ощутите разницу.
Выводы, нейросеть Шедеврум научится правильно рисовать Чебурашку и других персонажей советских и российских мультфильмов, фильмов и книг тогда, когда разработчики от Яндекса вспомнят, что понятие «российская нейросеть» - это нейросеть, прежде всего, для россиян, и пойдут навстречу нашим пользователям.
Возможно, вас заинтересует: