Яндекс представил бета-версию приложения Шедеврум, основанного на отечественной нейросети, которая генерирует изображения по текстовым запросам. Этот прототип нейросети значительно проще в использовании, чем Stable Diffusion и Midjourney, и при этом имеет родное, отечественное происхождение.
Нейросеть Шедеврум обладает уникальными характеристиками
Нейросеть Шедеврум охватывает как русский, так и английский языки, и проявляет особую предпочтительность к конкретным запросам. Чем более подробное описание предоставлено, тем более точным будет результат. Шедеврум способен учитывать специфические пожелания, такие как "фотореализм" или "высокая детализация", и может подражать известным художникам или работать в определенных художественных стилях.
Нейросеть Шедеврум использует метод каскадной диффузии для формирования изображений. Она начинает с создания образов в соответствии с текстовым запросом, а затем постепенно увеличивает их разрешение, обогащая их деталями. Разработчики обучили первую версию нейросети на огромном наборе данных, состоящем из 240 миллионов изображений с соответствующими текстовыми описаниями, чтобы использовать их для бета-тестирования. В настоящее время обучение продолжается на ещё более объемном наборе данных, включающем 500 миллионов примеров. Качество работы нейросети будет постепенно улучшаться в будущих обновлениях.
Как осуществить подключение к нейросети Шедеврум
Для просмотра готовых изображений достаточно скачать Шедеврум.
Интерфейс приложения предельно прост и интуитивно понятен. В настоящее время он состоит из двух вкладок с изображениями, которые были сгенерированы пользователями и разделены на категории "Недавние" и "Лучшие".
На вкладке с лучшими изображениями присутствует простой фильтр, позволяющий сортировать изображения по дате создания: за всё время, за неделю и за день.
Интересно, что ротация изображений осуществляется через лайки! Да, вы правильно слышали - лайки. Возможно, в будущем это приложение превратится в небольшую социальную сеть для любителей генерировать изображения.
Пользователь может запрашивать у искусственного интеллекта четыре варианта изображений по своему запросу и выбрать наилучший из них. Готовые работы отображаются как в общей ленте, так и в подборках. Описание "Шедеврума" указывает, что количество попыток не ограничено: пользователь может генерировать столько картинок, сколько пожелает.
Для доступа к самому приложению достаточно отправить запрос на доступ к нейронной сети и дождаться ответа.
Проверьте в найстроках приложения, что вы разрешили присылать уведомления!
Для создания изображения в Шедевруме вам следует учесть следующие шаги
- При попытке создать изображение вы увидите сообщение, что приложение все еще находится в стадии бета-тестирования, и генерация доступна не для всех. Ниже на экране будет располагаться серая кнопка "Хочу создавать". При нажатии на нее вы попадете в виртуальную очередь.
- Вам потребуется некоторое время ожидания (от нескольких минут до нескольких десятков), после чего вы получите push-уведомление с сообщением, что теперь вы можете начинать.
- Затем следует просто ввести несколько фраз или описание того, что вы хотите увидеть, и запустить генерацию. При каждом запросе вам будут представлены 4 варианта изображений для выбора, и вы сможете поделиться лучшей версией с другими пользователями приложения, а также добавить ее в свою галерею.
В приложении Шедеврум имеются определенные ограничения, которые ограничивают возможности нейросети. Авторы приложения установили следующие ограничения
- Запросы, содержащие отсылки к конкретным людям, так как приложение не должно оскорблять никого или становиться источником создания дипфейков.
- Темы, связанные с политикой и религией.
- Запросы, относящиеся к категории "18+".
- Темы, связанные с жестокостью и насилием.
Иногда эти ограничения работают несколько странно. Сложные запросы блокируются без проблем. Например, были случаи, когда запросы на создание изображения "Демьянова уха" (название басни Крылова) были заблокированы.
Нейросеть сообщила, что "нельзя делать картинки про любых конкретных людей". Видимо, ей еще нужно больше обучиться, чтобы в будущем лучше различать "творческий запрос" от "неприемлемого".
Ниже представлены примеры изображений, сгенерированных нейросетью Шедеврум, которые были предоставлены пресс-службой Яндекса.
Мы тоже получили доступ к сети и ниже поделимся своими результатами
Промты для нейросети Шедеврум
Как мы и писали ранее, работать с этой нейросетью очень просто, тут не надо познавать тонкости написания промтов из других нейросетей, в Шедевруме достаточно написать желаемое и в течении 1-2 минут вы получите результат:
Запрос:
- детализированное макро фото улитки на листике, с капельками росы
Запрос:
- кот и лампа
Запрос:
- Россия глазами нейросети шедеврум, Россия матушка, красивое лицо, фотореалистично, традиционный наряд, современный вид
Запрос:
- ниндзя в полигонном стиле, поля сакуры на фоне
Запрос:
- кошачий вихрь в открытом космосе фотореализм
Запрос:
- Екатеринбург в 3854 году
Запрос:
- Нео из матрицы Кушает узбекский Плов
Что дальше?
Сейчас нейросеть представляет собой прототип, и разработчики обещают улучшить ее к финальному релизу. «Шедеврум» будет генерировать иллюстрации, баннеры, создавать изображения для интернет-витрин и многое другое.
Алексей Гусаков,
руководитель управления машинного интеллекта и исследований Яндекса.
Мы пока в самом начале пути. В основе Шедеврума прототип нейросети, которой предстоит многому научиться. К моменту финального релиза она сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только. Бета-тест приложения для пользователей — это новый опыт и немного хорошего настроения, для нас — возможность чуть лучше понять, в каком направлении развивать нейросеть дальше
Однако, на данный момент при генерации изображений нейросеть все еще не справляется с глазами и руками, а некоторые изображения сильно напоминают изображения, которые есть в Яндекс Картинках, но вспоминая какие изображения выдавала Midjourney, можно довериться словам разработчиков из Яндекса.
Данная статья будет дополняться, по мере выхода новых и интересных новостей про Шедеврум.
Больше подобного можете найти в моем телеграмм канале : Лучшее Midjourney | Stable Diffusion | Шедеврум