Найти в Дзене

Нейронные сети как новый способ создания NFT

Оглавление
Из открытых источников
Из открытых источников

Нейронные сети - одна из моделей реализации возможностей машинного обучения и искусственного интеллекта. Это старый, большой и быстро развивающийся рынок: в 2018 году он оценивался в $10,1 млрд, к 2025 году предполагаемый объем сектора может составить $126 млрд.

До сих пор искусственный интеллект и нейронные сети использовались в основном для решения корпоративных задач, таких как оптимизация и улучшение работы поисковых систем Яндекс и Google. В 2022 году наметилась другая тенденция, ориентированная в первую очередь на частных пользователей: ИИ (искусственный интеллект) как инструмент для развлечения и творчества.

Широкая аудитория узнала, что нейронные сети можно использовать для создания цифровых арт-объектов, и эта технология тесно переплетается с криптовалютами и NFT.

Нейронные сети: каковы их виды

Нейронные сети - это достаточно сложная технология, которую можно классифицировать по десяткам признаков. В данной статье рассматриваются программы, предназначенные для создания объектов искусства - по основному принципу работы и взаимодействию с пользователем их можно разделить на следующие группы:

  • Текст в изображение
  • Изображение в изображение
  • Чат-боты


Текст в изображение (Text to Image)

Нейронные сети типа "Текст в изображение" работают следующим образом:

  1. Пользователь вводит в поле интерфейса слово, набор слов или предложение;
  2. Искусственный интеллект обрабатывает текст и выдает определенное изображение или группу изображений.

Эта модель основана на принципе одного из самых сложных когнитивных процессов в человеческом разуме. Когда человек читает книгу, слушает рассказ или занимается умственной деятельностью, в мозгу возникают ассоциативные визуальные образы, иллюстрирующие поступающую информацию.

Текст в изображение - самый распространенный тип нейронных сетей.

Изображение в изображение (Image to Image)

Другим, хотя и не столь распространенным, методом генерации изображений является "изображение в изображение". Иногда его также называют "Drag and Drop". Для создания изображений в нейронных сетях этого типа за основу берется существующее изображение, эскиз или фотография.

Например, Artbreeder использует комбинированный метод - изображение, дополненное текстовым описанием. Для генерации изображения сервис предлагает пользователю создать коллаж из элементов основы изображения и текстового описания того, что необходимо получить.

Существует также экспериментальный проект Nerf in The Wild: робот способен создавать трехмерные видеоролики из нескольких изображений объекта, снятых под разными углами. Пока вы не можете использовать его в своих целях, но это один из ярких примеров модели Image to Image - или, в данном случае, Image to Video.

Чат-боты

Чатботы - это альтернативная веб-сервисам модель взаимодействия между человеком и нейронной сетью. Первые примитивные боты появились еще в 1966 году, но с тех пор ИТ сделали огромный скачок вперед: современные обученные машины поддерживают сознательный и разумный разговор не хуже реального человека. Новый текстовый чат-бот от разработчика Open AI, запущенный в 2022 году, ChatGPT, способен не только вести осмысленный диалог, но и давать развернутые ответы на вопросы - даже очень сложные. Иногда этот бот может быть полезнее Google и способен писать небольшие аналитические статьи.

Такие чат-боты используются не только для общения - со временем их научили генерировать изображения в ответ на команду пользователя. У Open AI есть такой проект.

Какие нейронные сети используются для создания NFT

На сегодняшний день создано множество нейронных сетей для генерации изображений - многие из них появились только в 2022 году, когда тренд на ИИ и машинное обучение достиг очередного пика. Упомянутый выше Open Ai, предлагающий похожие функции, называется DALL-E 2 и создает изображения на основе текстового описания.

Достаточно ввести несколько слов, и искусственный интеллект предложит четыре соответствующие фотографии, составленные им самим:

DALL-E 2
DALL-E 2

Или изображения, если запрос немного уточнен:

DALL-E 2
DALL-E 2

Другая платформа под названием Deep Dream Generator - пример сервиса, который может создавать новые картины на основе загруженного изображения и текстового описания. Вот как выглядит "Звездная ночь" Ван Гога, пропущенная через искусственный интеллект:

Deep Dream
Deep Dream

Еще один инструмент, который поможет создавать картинки в пару кликов, - MindJourney. Это тоже новинка: открытое бета-тестирование началось 13 июля 2022 года, о чем разработчики объявили в своем Twitter.

В отличие от предыдущих сервисов, MindJourney работает только как чат-бот на платформе Discord - о том, как им пользоваться, мы расскажем позже.

Как создать NFT в Mindjourney

Вот официальный сайт проекта, где вам нужно зарегистрироваться, чтобы создавать образы: https://www.midjourney.com/home/.

Команда MindJourney подготовила небольшое руководство для пользователя - это самые важные правила:

  1. Генератор нельзя использовать для создания картинок, содержащих сцены насилия, кровь и контент для взрослых;
  2. Количество бесплатных попыток создания изображения ограничено - после 25 изображений необходимо оплатить подписку;
  3. Если вы создаете изображения бесплатно, общение с ботом происходит в официальном или стороннем чате, владелец которого подключил бота. Те, кто оплатил индивидуальную подписку, могут генерировать изображения в личном чате.

Пока сервис работает только на английском языке, который также используется для ввода команд и описаний.

Создание изображения через Discord

Используйте ссылку приглашения на официальный канал MindJourney, чтобы присоединиться к чату. Перед этим вам нужно создать аккаунт в Discord - для этого достаточно адреса электронной почты.

Канал проекта выглядит следующим образом:

Discrod MindJourney
Discrod MindJourney

В нем есть несколько чатов, но для создания изображений нам нужен раздел под названием "Newby" - их несколько, и неважно, какой из них выбрать. Чтобы запустить бота, нужна всего одна команда:

/imagine

В командной строке появится область promt, в которую нужно ввести описание будущей картинки - для этого можно воспользоваться переводчиком. Чем подробнее будет описание, тем точнее получится картинка. Ради эксперимента мы решили дать боту собственное задание: сгенерировать живописный лесной пейзаж со стоящим посередине оленем. В описание было добавлено несколько деталей:

Запрос в Discord
Запрос в Discord

После отправки запроса боту потребуется около 60 секунд, чтобы сгенерировать четыре изображения. В процессе мы смогли наблюдать, как преобразуется каждое из изображений, и результат получился следующим:

Изображение после генерации ботом
Изображение после генерации ботом

Теперь это изображение можно использовать на любой торговой площадке NFT, например, OpenSea или Binance NFT. На Binance, чтобы получить право на создание токенов, необходимо набрать как минимум двух подписчиков - можно пригласить друзей или родственников, а затем выполнить следующие шаги:

  1. Загрузите файл изображения, созданный с помощью бота;
  2. Придумайте описание и название токена;
  3. Выберите сеть (например, Binance Smart Chain);
  4. Оплатите комиссию в размере 0,005 BNB.

Какие типы NFT могут быть созданы с помощью нейронной сети

Коллекционные токены оставались самой популярной и востребованной нишей в секторе NFT, включая последний квартал 2022 года.

Эта тенденция, вероятно, сохранится и в 2023 году. Но собирать можно не только картинки или аватары: благодаря навыкам искусственного интеллекта и нейронных сетей пользователи могут создавать NFT на основе музыки, 3D-моделей и даже поэзии.

3D-модели

Компания Open AI, разработавшая чат-боты и сервисы для генерации изображений, в конце 2022 года представила еще один проект - нейронную сеть для создания 3D-моделей Point-E. Она работает по принципу "Text to Image": в поле необходимо ввести краткое описание, на его основе будет сгенерирована модель.

Эта концепция очень молода и очень сложна в реализации - поэтому работа Point-E пока еще довольно примитивна:

3D модель мотоцикла в Point-E
3D модель мотоцикла в Point-E

Опыт предыдущих проектов такого типа говорит о том, что нужно просто немного подождать, и со временем программа научится создавать полноценные 3D-модели.

Музыка

Музыка уже давно продается в виде NFT - даже у Снуп Догга есть своя коллекция на OpenSea. Чтобы сделать то же самое, не обязательно создавать собственные треки с нуля: для этого успешно используются нейронные сети.

Для создания музыки в нейросети BOOMY нужно выбрать всего два параметра - стиль и тему. После генерации записи сервис предлагает отредактировать композицию и добавить в нее вокал.

Поэзия

Нейронные сети могут не только общаться, но и создавать целые произведения - эссе и даже стихи. Мы нашли сервис под названием Poem Portraits от Google, который генерирует текст из базового слова и создает открытку с вашим селфи.

AI Poem Generator работает без селфи - вместо этого ему нужно задать несколько слов и ассоциаций для будущего стихотворения.

Логотипы

Однако коллекции и заработок - не единственная область, для которой можно создавать NFT с помощью нейронных сетей. Looka - это сервис, который генерирует логотипы на основе заданных параметров. Разработанный таким образом логотип можно оцифровать и тем самым защитить право собственности на изображение.

Вывод

Искусственный интеллект для создания цифрового искусства как новый тренд в секторе NFT был спрогнозирован в начале 2022 года. Ожидания оправдались - к середине 2022 года интерес пользователей к генераторам изображений возрос как никогда ранее.

ИИ стал доступным и очень простым способом создания NFT. После окончания тенденции медвежьего тренда на рынке и возвращения былого спроса на неиграбельные токены, искусство, созданное с помощью нейронных сетей, может многократно вырасти в цене - и этим определенно стоит воспользоваться.