Будущее уже наступило. И пока оно даже бесплатное.
Уникальные картинки для обвеса статей — что может быть более желанным подарком любому пишущему редактору/блогеру? Сгенерировал в соседней вкладке за 3 минуты, вставил — красииииво — и радуешься сильно. Этой возможности мы все ждем от нейросетей, желательно еще и бесплатно. Но реальность пока вообще не такова. Яндекс представил бета-версию «Шедеврума», а Сбер — обновленную версию Kandinsky 2.1. Что они умеют, есть ли от них польза и что можно делать с полученной картинкой?
Ура, ура, отечественные нейросети!
Сервисы Яндекса и Сбера по генерации изображений — это такой российский ответ Midjourney. И если Kandinsky 2.1 — уже усовершенствованная версия, прошедшая дополнительное обучение, то «Шедеврум» только учится. Во всяком случае тест-мем про пять пальцев на руке нейросеть ожидаемо завалила. Картинка и промт к ней (текстовое описание желаемого результата) завирусились сразу же.
Ну и подумаешь, что рука не удалась. У нейросетей с руками вообще проблемы. Тут разбираться надо.
Что умеет «Шедеврум»
«Шедеврум» работаетчерез мобильное приложение (на iOS и Android). На стадии бета-тестирования по запросу создает 4 картинки на выбор. Говорят, если умеючи сформулировать запрос, то можно получить крутой результат. Сетка, кстати, понимает и русский, и английский.
Но вот, что сразу бросается в глаза — так это отсутствие кнопки «Скачать». Нет ее. Зато есть лента, в которую пользователи Беты могут выложить свои творения. Результат публикуется с указанием аккаунта пользователя в Яндексе и описанием. Хм. Идем в пользовательское соглашение, а там:
Что в переводе означает: 3.3. Пользователь может использовать Изображения, полученные с помощью Сервиса, исключительно в личных, некоммерческих целях, указав Сервис в качестве источника Изображения.
Странно, но правила только на английском языке.
Получается, что «Шедеврум» - это не инструмент, а соцсеть для развлечения. Использовать полученные изображения без подписи источника или для производства рекламы, например, нельзя. Хотя вот Лентач в Telegram сгенерировал себе аватарку, подписал источник прямо на ней — и нормально. Возможно, это было сделано в рамках пиар-кампании «Шедеврум» или не считается коммерческой целью. Но хотелось бы тогда подробных разъяснений по использованию. Кстати, в запросе нейросеть не отказывается создавать логотипы:
В продукте Яндекса есть и другие ограничения, касающиеся запросов на создание картинки. Нейросеть откажется творить, если в запросе будут стоп-слова или темы, нарушающие правила.
В любом случае, если «Шедеврум» задумана как соцсеть, то она может стать еще одним проходным развлечением, про которое быстро забудут. А жаль. Будем надеяться, что после бета-тестирования что-то изменится. А пока ставим лайки в ленте странным картинкам друг друга.
Кстати, это не единственная нейросеть, над которой работает Яндекс, судя по некоторым вакансиям на hh.ru.
А что у Kandinsky 2.1?
Kandinsky 2.1 тоже хорошо справляется с запросами на русском и английском языках. Всего знает 101 язык. Но я столько не знаю, проверить не могу.
Нейросеть доступна:
Все это очень удобно. Но что насчет использования?
Александр Ведяхин, первый заместитель председателя правления Сбербанка, назвал Kandinsky 2.1 мощным универсальным решением:
«Мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это еще один важный шаг к AGI — сильному искусственному интеллекту. Думаю, у каждого найдется задача для Kandinsky 2.1, и поэтому улучшенная модель, как и ее предыдущая версия, находится в открытом доступе: протестировать ее может любой желающий, причем бесплатно».
В пользовательском соглашении про запрет на деятельность тоже ничего нет. Кроме ожидаемого запрета на продажу картинок. Я не нашла больше ничего такого.
Что по возможностям Kandinsky 2.1?
Нейросеть умеет рисовать, изменять изображение, смешивать рисунки и дорисовывать. Можно задать желаемый размер и форму изображения. Ну и конечно, чем подробнее описание, тем лучше результат. Круче всего выходит у тех, кто может объяснить желаемый результат нейросети в параметрах и цифрах.
Косяки все те же — кривые руки, перебор с количеством конечностей, факапы с глазами. Человеки — они в рисовании сложные. Энивей, Сбер пока Яндекс обгоняет. А главное — разрешает пользоваться. Может быть, Kandinsky скоро станет для коммерции платным, как Midjourney. Но радоваться все равно есть чему. Такой инструмент, немсомненно, нужен.
Посравниваем
Ну и напоследок, конечно, давайте посмотрим, как одно и то же рисуют Шедеврум и Kandinsky.
Как заметили другие блогеры, "Шедеврум" подтягивает иззображени] из Яндекс Картинок. Поэтому, возможно, с простыми запросами справляется быстрее.
Руки, пропорции, вот это вот все. Клешня от Kandinsky.
Какие времена, такой и Ренессанс, решил "Шедеврум".
А что вы думаете о развитии нейросетей. Нужны ли они в работе или от них будут одни проблемы и нарушения авторских прав? Вы бы пользовались нейросетью за деньги? Почему?
Пишите в комменты! 👇
А подписаться на канал можно тут. Лайки приветствуются!