Нейросеть Midjourney, известная также как «пол-пути», нарисовала героев Поттерианы в виде самураев и сделала это чертовски хорошо.
В прошлом году мы забавлялись с нейросетевым ботом, заказывая изображения собственные, а также родственников и знакомых и получая невразумительное нечто из плавающих в геле обрезков насыщенно ярких цветов. Не знаю как вы, а я предположить не могла, что не пройдет и года, как умница Midjourney станет создавать тематические картины такого уровня реалистичности.
Посмотрите, как она нарисовала героев «Гарри Поттера» в самурайском стиле.
Нейросеть — это искусственный интеллект, работающий по принципу человеческого мозга. Нейроны получают, обрабатывают и отдают информацию, а связи передают конечный продукт потребителю. Особенность нейросетей в том, что их нужно постоянно обучать, такая опция как самообучаемость в них пока не встроена. Но должным образом обученные, эти штуки умеют разговаривать с человеком, писать музыку и генерировать тексты, переводить с одного языка на другой, рисовать картины. Midjourney — это как раз сеть, специализирующаяся на изображениях.
А поскольку в последнее время она набирает всё большую популярность, расскажу немного о принципах взаимодействия. Для того, чтобы получить доступ к Midjourney, в первую очередь нужно зарегистрироваться на дискорде. Discord — это замечательно интересное пространство, сочетающее мессенджер и площадку для разного рода ботов с приоритетом не в продвижении отдельных каналов, как в большинстве соцсетей и блогерских платформ, а во взаимодействии и сотрудничестве пользователей.
После регистрации вы получаете доступ ко всем ботам Discord и стартовый бонус в виде 25 GPU-минут, которых хватает в среднем на 25 действий с сетью. GPU-минуты расходуются на все действия. Дальше вы почувствуете себя немного программистом, потому что заказ изображения делается командой (/imagine prompt:), после которой вводите то, что хотите увидеть. Делать это лучше на английском: Midjourney понимает и другие языки, но практика показывает, что наиболее интересные и в точности соответствующие желаемому изображения генерируются в ответ на запрос на английском.
Через некоторое время вы получите серию из четырех картинок, с которыми кнопками u1 — u4 можно произвести апскейлинг (увеличение изображения) отдельной или создать еще варианты на основе наиболее понравившейся кнопками v1 — v4. Есть также кнопка web, открывающая доступ к изображению в галерее дискорда. Все кнопки, кроме web, будут стоить вам минут.
На самом деле это безумно интересная забава, использовать которую можно не только для развлечения, но и для создания уникальных обложек и иллюстраций для своих текстов. Все мы здесь, на LiveLib что-то пишем, и неплохо было бы иметь доступ к эксклюзивным изображениям вместо того, чтобы разыскивать подходящие картинки в интернетах с риском быть обвиненными в использовании чужой интеллектуальной собственности и нарушении авторского права, если какой-то из проектов «выстрелит».
В конце концов, Джоан Роулинг ведь тоже не предполагала, что франшиза Гарри Поттера будет оцениваться в 43 000 000 000 долларов. И это только по состоянию на январь 2021 года.
Бесплатная бета-версия предполагает возможность пользоваться базовыми функциями при отсутствии доступа к некоторым платным. А сколько стоит это удовольствие в платном варианте? Базовый тариф — 10 долларов в месяц дает доступ к 200 GPU-минутам, стандартный — за $30−15 GPU-часов. Для того, чтобы использовать в качестве игрушки — недешевое удовольствие, но для работы вполне приемлемо. Впрочем, каждый выбирает для себя.
В мире, оказывается, есть уйма интересных вещей, о которых нелишне знать.
Текст: Майя Ставитская