Нейронные сети - одна из моделей реализации возможностей машинного обучения и искусственного интеллекта. Это старый, большой и быстро развивающийся рынок: в 2018 году он оценивался в $10,1 млрд, к 2025 году предполагаемый объем сектора может составить $126 млрд.
До сих пор искусственный интеллект и нейронные сети использовались в основном для решения корпоративных задач, таких как оптимизация и улучшение работы поисковых систем Яндекс и Google. В 2022 году наметилась другая тенденция, ориентированная в первую очередь на частных пользователей: ИИ (искусственный интеллект) как инструмент для развлечения и творчества.
Широкая аудитория узнала, что нейронные сети можно использовать для создания цифровых арт-объектов, и эта технология тесно переплетается с криптовалютами и NFT.
Нейронные сети: каковы их виды
Нейронные сети - это достаточно сложная технология, которую можно классифицировать по десяткам признаков. В данной статье рассматриваются программы, предназначенные для создания объектов искусства - по основному принципу работы и взаимодействию с пользователем их можно разделить на следующие группы:
- Текст в изображение
- Изображение в изображение
- Чат-боты
Текст в изображение (Text to Image)
Нейронные сети типа "Текст в изображение" работают следующим образом:
- Пользователь вводит в поле интерфейса слово, набор слов или предложение;
- Искусственный интеллект обрабатывает текст и выдает определенное изображение или группу изображений.
Эта модель основана на принципе одного из самых сложных когнитивных процессов в человеческом разуме. Когда человек читает книгу, слушает рассказ или занимается умственной деятельностью, в мозгу возникают ассоциативные визуальные образы, иллюстрирующие поступающую информацию.
Текст в изображение - самый распространенный тип нейронных сетей.
Изображение в изображение (Image to Image)
Другим, хотя и не столь распространенным, методом генерации изображений является "изображение в изображение". Иногда его также называют "Drag and Drop". Для создания изображений в нейронных сетях этого типа за основу берется существующее изображение, эскиз или фотография.
Например, Artbreeder использует комбинированный метод - изображение, дополненное текстовым описанием. Для генерации изображения сервис предлагает пользователю создать коллаж из элементов основы изображения и текстового описания того, что необходимо получить.
Существует также экспериментальный проект Nerf in The Wild: робот способен создавать трехмерные видеоролики из нескольких изображений объекта, снятых под разными углами. Пока вы не можете использовать его в своих целях, но это один из ярких примеров модели Image to Image - или, в данном случае, Image to Video.
Чат-боты
Чатботы - это альтернативная веб-сервисам модель взаимодействия между человеком и нейронной сетью. Первые примитивные боты появились еще в 1966 году, но с тех пор ИТ сделали огромный скачок вперед: современные обученные машины поддерживают сознательный и разумный разговор не хуже реального человека. Новый текстовый чат-бот от разработчика Open AI, запущенный в 2022 году, ChatGPT, способен не только вести осмысленный диалог, но и давать развернутые ответы на вопросы - даже очень сложные. Иногда этот бот может быть полезнее Google и способен писать небольшие аналитические статьи.
Такие чат-боты используются не только для общения - со временем их научили генерировать изображения в ответ на команду пользователя. У Open AI есть такой проект.
Какие нейронные сети используются для создания NFT
На сегодняшний день создано множество нейронных сетей для генерации изображений - многие из них появились только в 2022 году, когда тренд на ИИ и машинное обучение достиг очередного пика. Упомянутый выше Open Ai, предлагающий похожие функции, называется DALL-E 2 и создает изображения на основе текстового описания.
Достаточно ввести несколько слов, и искусственный интеллект предложит четыре соответствующие фотографии, составленные им самим:
Или изображения, если запрос немного уточнен:
Другая платформа под названием Deep Dream Generator - пример сервиса, который может создавать новые картины на основе загруженного изображения и текстового описания. Вот как выглядит "Звездная ночь" Ван Гога, пропущенная через искусственный интеллект:
Еще один инструмент, который поможет создавать картинки в пару кликов, - MindJourney. Это тоже новинка: открытое бета-тестирование началось 13 июля 2022 года, о чем разработчики объявили в своем Twitter.
В отличие от предыдущих сервисов, MindJourney работает только как чат-бот на платформе Discord - о том, как им пользоваться, мы расскажем позже.
Как создать NFT в Mindjourney
Вот официальный сайт проекта, где вам нужно зарегистрироваться, чтобы создавать образы: https://www.midjourney.com/home/.
Команда MindJourney подготовила небольшое руководство для пользователя - это самые важные правила:
- Генератор нельзя использовать для создания картинок, содержащих сцены насилия, кровь и контент для взрослых;
- Количество бесплатных попыток создания изображения ограничено - после 25 изображений необходимо оплатить подписку;
- Если вы создаете изображения бесплатно, общение с ботом происходит в официальном или стороннем чате, владелец которого подключил бота. Те, кто оплатил индивидуальную подписку, могут генерировать изображения в личном чате.
Пока сервис работает только на английском языке, который также используется для ввода команд и описаний.
Создание изображения через Discord
Используйте ссылку приглашения на официальный канал MindJourney, чтобы присоединиться к чату. Перед этим вам нужно создать аккаунт в Discord - для этого достаточно адреса электронной почты.
Канал проекта выглядит следующим образом:
В нем есть несколько чатов, но для создания изображений нам нужен раздел под названием "Newby" - их несколько, и неважно, какой из них выбрать. Чтобы запустить бота, нужна всего одна команда:
/imagine
В командной строке появится область promt, в которую нужно ввести описание будущей картинки - для этого можно воспользоваться переводчиком. Чем подробнее будет описание, тем точнее получится картинка. Ради эксперимента мы решили дать боту собственное задание: сгенерировать живописный лесной пейзаж со стоящим посередине оленем. В описание было добавлено несколько деталей:
После отправки запроса боту потребуется около 60 секунд, чтобы сгенерировать четыре изображения. В процессе мы смогли наблюдать, как преобразуется каждое из изображений, и результат получился следующим:
Теперь это изображение можно использовать на любой торговой площадке NFT, например, OpenSea или Binance NFT. На Binance, чтобы получить право на создание токенов, необходимо набрать как минимум двух подписчиков - можно пригласить друзей или родственников, а затем выполнить следующие шаги:
- Загрузите файл изображения, созданный с помощью бота;
- Придумайте описание и название токена;
- Выберите сеть (например, Binance Smart Chain);
- Оплатите комиссию в размере 0,005 BNB.
Какие типы NFT могут быть созданы с помощью нейронной сети
Коллекционные токены оставались самой популярной и востребованной нишей в секторе NFT, включая последний квартал 2022 года.
Эта тенденция, вероятно, сохранится и в 2023 году. Но собирать можно не только картинки или аватары: благодаря навыкам искусственного интеллекта и нейронных сетей пользователи могут создавать NFT на основе музыки, 3D-моделей и даже поэзии.
3D-модели
Компания Open AI, разработавшая чат-боты и сервисы для генерации изображений, в конце 2022 года представила еще один проект - нейронную сеть для создания 3D-моделей Point-E. Она работает по принципу "Text to Image": в поле необходимо ввести краткое описание, на его основе будет сгенерирована модель.
Эта концепция очень молода и очень сложна в реализации - поэтому работа Point-E пока еще довольно примитивна:
Опыт предыдущих проектов такого типа говорит о том, что нужно просто немного подождать, и со временем программа научится создавать полноценные 3D-модели.
Музыка
Музыка уже давно продается в виде NFT - даже у Снуп Догга есть своя коллекция на OpenSea. Чтобы сделать то же самое, не обязательно создавать собственные треки с нуля: для этого успешно используются нейронные сети.
Для создания музыки в нейросети BOOMY нужно выбрать всего два параметра - стиль и тему. После генерации записи сервис предлагает отредактировать композицию и добавить в нее вокал.
Поэзия
Нейронные сети могут не только общаться, но и создавать целые произведения - эссе и даже стихи. Мы нашли сервис под названием Poem Portraits от Google, который генерирует текст из базового слова и создает открытку с вашим селфи.
AI Poem Generator работает без селфи - вместо этого ему нужно задать несколько слов и ассоциаций для будущего стихотворения.
Логотипы
Однако коллекции и заработок - не единственная область, для которой можно создавать NFT с помощью нейронных сетей. Looka - это сервис, который генерирует логотипы на основе заданных параметров. Разработанный таким образом логотип можно оцифровать и тем самым защитить право собственности на изображение.
Вывод
Искусственный интеллект для создания цифрового искусства как новый тренд в секторе NFT был спрогнозирован в начале 2022 года. Ожидания оправдались - к середине 2022 года интерес пользователей к генераторам изображений возрос как никогда ранее.
ИИ стал доступным и очень простым способом создания NFT. После окончания тенденции медвежьего тренда на рынке и возвращения былого спроса на неиграбельные токены, искусство, созданное с помощью нейронных сетей, может многократно вырасти в цене - и этим определенно стоит воспользоваться.