Искусственные нейронные сети умнеют с каждым днем. Создают картины, монтируют анимационные ролики, некоторые вот музыку сочиняют. Мобильные приложения одним нажатием кнопки сгенерируют за несколько секунд то же, что при рисовании вручную в Photoshop у меня займет несколько часов. И конечно, наибольшим успехом пользуются нейросети, пишущие тексты. Автоматического контента становится все больше. Нейросети предлагаются в качестве решений для бизнеса. Пока успехи их еще не столь высоки, часты ошибки. Поэтому на сайтах иногда появляются некорректные описания товаров, а загнанные в тупик телефонные чат-боты вызывают бурю эмоций у представителей старших поколений, не понимающих, что с ними ведет диалог компьютер. Тем не менее эти системы быстро совершенствуются и уже сейчас способны делать многое, разгружая операторов по работе с клиентами. Оставить заявку? Вызвать такси по адресу? Нет проблем!
Мне выпало счастье родиться в то время, когда компьютерные технологии развивались семимильными шагами. Каждый день появлялось новое. Мечты на глазах становились явью. Еще в детские годы мне попалась статья о постепенном подчинении человека и его частной жизни компьютерному интеллекту. Заголовок гласил: "Dr. Computer horcht uns alle aus" ("Доктор Компьютер слышит нас всех"). Читал текст на русском языке - не то в советском издании, не то в международном, типа "Курьера", выходившем сразу на нескольких языках. Повествовательная часть меня мало удивила, а вот суровый коллаж в истинно немецком стиле, на котором были изображены бритоголовые люди, подключенные проводами к информационной сети, впечатлил. Я вырезал журнальную иллюстрацию и поместил ее на кассету с индастриалом. Вот так сборник тяжелой электронной музыки разных авторов стал выглядеть по-настоящему серьезно.
Обычная практика - собирать наклейки, фантики, журнальные картинки, открытки, лейблы с одежды. Комбинировать, создавать коллажи, декор, подчас в самых необычных сочетаниях. Как это называлось на бытовом уровне, поп-арт или китч? Недавно вспомнил про то изображение, принялся искать в интернете информацию об оригинале. Выяснил: публикация Себастьяна Коблера в "Штерн" N.34, 09 / 1981. Нашел снимок журнальной страницы. Правда, только половину разворота. У меня в журнале иллюстрация была меньших размеров.
Всевозможные арты, романтизировавшие образы машин, часто подвергались критике. Не любили, не понимали их сторонники классической живописи, а также некоторые общественные активисты. Больше всего их волновали три вещи: 1) обесценивание настоящего искусства; 2) отведение человеку второстепенной роли либо его полное вытеснение неодушевленными предметами; 3) продвижение "анти-искусства" с целью формирования сниженных общественных вкусов. Даже советские авторы не оставались в стороне от осуждения изобразительного механицизма, хотя в СССР любили роботов и воспевали успехи индустрии.
Кому как, а меня порадовала "Металлическая муза" Джорджа Барра. Да еще со скрипкой. Хороший, годный, ламповый дизайн.
Насчет "ультраавангардных" направлений согласен - незачем строить целый павильон для одной линии, нарисованной во всю стену, или выставлять пустую раму высотой с двухэтажный дом.
Когда сотрудничаешь с маленькими творческими коллективами, доводится выполнять функции не только музыканта, звукорежиссера, техника, но и художника по костюмам, декоратора, оформителя. Работу всех и сразу. Часто - на чистом энтузиазме. Множество рисунков, эскизов, концепт-артов было нарисовано акварелью, гуашью, акрилом; изготовлено макетов из бумаги, картона, ткани, дерева, пластика. Пусть я рисую неважно по сравнению с художниками, имеющими классическую базу, и нет такого отточенного стиля, как у профессиональных дизайнеров, зато понимаю, как это будет выглядеть в натуральную величину. Приветствую хэндмейд, иногда и обложки своих альбомов рисую вручную, продумывая сюжет и композицию. С редакторами компьютерной графики тоже знаком: Paint, Corel Draw, Photoshop, Illustrator и т.д.
Но нейросети - страшная сила. Лет десять назад никто не воспринимал всерьез сервисы генерации изображений по запросу. Они выдавали абстракции, нелепицу, редко имеющую отношение к заданной теме. Об их существовании знали три с половиной анонимуса. Прошло достаточно много времени, чтобы технологии научились адекватно распознавать текстовые запросы и создавать фотореалистичные картины.
В наше время такие онлайн-генераторы как Midjourney, Шедеврум, RuDalle уже на что-то способны и ими пользуется огромное количество людей. Новые версии Photoshop и приложений для фото- видеосъемки интегрированы в нейросети. Каждая девушка знает о бьюти-приложениях, в один клик максирующих недостатки лица, подтягивающих кожу, наносящих макияж. Кто угодно способен сделать фото на телефон, тут же нажать кнопку обработки, выбрать один из понравившихся результатов, сохранить и поделиться в соцсетях.
А примерно двадцать лет назад для достижения аналогичного эффекта требовалось обладать хотя бы минимальными навыками рисования. Загрузить фото в Photoshop, GIMP, Paint Shop Pro, поработать кистями и штампами, наложить слои-маски. В качестве "трафарета" как правило использовалось лицо другого человека, знаменитости, журнальной модели, снятое в похожем ракурсе. Еще нужно найти подходящее! Далее оно накладывалось поверх оригинального снимка, подгонялось по размеру с помощью scale/rotate/distort, устанавливалось компромиссное значение прозрачности opacity= (обычно от 10 до 40 %), настраивалась цветовая гамма (levels, brightness, contrast) и с помощью маски слоя вырезалось все лишнее до тех пор, пока два лица не сложатся в одно. В более ранних версиях редакторов не было инструмента маски слоя, приходилось делать несколько резервных копий слоев, орудуя ластиками с разным "нажимом". Я уже молчу о способах ретуши и коллажирования в традиционной "пленочной" фотографии.
Разумеется, профессиональный фотограф, мастер фотошопа обработает изображение намного художественнее, креативнее, грамотнее, аккуратнее, чем это делают нейросети, однако массовым, доминирующим продуктом являются автоматические фильтры, выдающие неживые, восковые лица. Ключевой лозунг: просто, быстро, бесплатно. Все это верхушка айсберга по сравнению с тем, что компьютерные технологии уже диктуют человеку стандарты красоты.
Я в меру дружу с генераторами картинок. Составил сотни запросов на изображения людей в костюмах разных исторических эпох, арты в стиле стимпанк, всевозможные виды графики и т.д. Современные нейросети неплохо справляются с лицами, хотя по-прежнему испытывают сложности с рисованием конечностей. Даже если попросить изобразить отдельно кисть руки, часто ошибаются с анатомией и количеством пальцев. Кроме того ошибаются в устройстве музыкальных инструментов. Они "не знают", как расположены черные и белые клавиши на рояле, а гитарные струны то не попадают в колки, то прячутся под деку.
Вместе с тем результаты: а) намного лучше, чем были 5-7 лет назад; б) довольно легко поддаются правкам в графическом редакторе; в) выходят гораздо быстрее, чем придумывание дизайна с нуля.
Если ничего больше не приходит на ум, обращаюсь к нейросетям и оцениваю предложенное свежим взглядом. Попросить сервис изобразить прекрасную даму, играющую на клавесине, гораздо проще, чем: а) ждать появления подходящего фото на стоках; б) искать даму, клавесин, заказывать историческое платье и устраивать фотосессию; в) создавать цифровой фотомонтаж вручную, подбирая исходники; г) рисовать фотореалистичное изображение от- и -до при помощи графического планшета. Достаточно указать сервису "высокий реализм", "профессиональное фото", при желании детализировать фокусное расстояние линзы, значения диафрагмы, светочувствительности и выдержки.
Очень скоро нейросети научатся лучше понимать человеческую анатомию и окружающий мир, поэтому станет трудно отличить настоящее фото от генерации. Сгенерированный контент уже мелькает всюду: от личных блогов до новостных лент крупных изданий. А что станет с художниками, зарабатывающими на жизнь исключительно цифровыми артами?
Нейро-движки, сочиняющие музыку - явление одновременно новое и не новое. В продвинутых моделях рабочих станций уже давно имеются автоарранжировщики, подбирающие аккорды, импровизирующие на заданную тему. Существовали и существуют оффлайновые программы, способные сгенерировать трек в соответствии с основными правилами и принципами. Достаточно указать им тональность, размер, лад - дорийский, фригийский, лидийский, миксолидийский и т.д. В деятельности музыканта они выполняют чисто технические задачи. К примеру, позволяют быстро прослушать определенную аккордовую прогрессию, с ходу обратить аккорды, оценить изменения, перевести тему из мажора в минор и тому подобное. В крайнем случае можно устроить джем-сейшн с программой. А нейросети вроде Musenet и AIVA предлагают больше возможностей. Например, обыграть песню группы "Битлз" в стиле Шопена или Рахманинова.
Сервис Riffusion набирает популярность при создании коротких роликов, аранжируя тексты и пропевая их голосом. Доступны разные варианты аранжировок: бит, рок, тванг, грув. Если не нравится один результат, нажимаем "обновить" и слушаем следующий. Дабы оценить более объективно, я взял хорошо известный текст - припев из Crazy Train и выбрал рок-варианты. Все оказались непохожими на Оззи Осборна, хотя отдельные интерпретации прямо-таки интересные.
Современные генеративные ИИ способны озвучивать помещения торговых центров, кафе, отелей. Достаточно написать запрос "испанская гитара" - и музыкальный генератор будет сколько угодно гонять испанскую гитару. Попросишь джаз, будет звучать джаз.
Пройдет еще немного времени, даже музыкальным группам станет выгоднее работать с нейросетями, чем приглашать сессионных музыкантов. Виртуальный саксофонист впишется лучше живого, состоящего из мяса и костей.
А что испытывает музыкант в профессии? К примеру, состоя в оркестре. Он ежедневно загружен множеством вопросов, далеких от музыки, вынужден решать организационные проблемы, взаимодействовать с начальством, отделом кадров, бухгалтерией, хозчастью, среди коллег-музыкантов присутствуют большие разногласия. Они постоянно выясняют, кто достоин, кто недостоин, кто сколько заработал и кто как потратил, кому можно, кому нельзя, ревностно относятся к успехам друг друга. Воздействие стресса, "заигранность" (в легкой форме - трудность освоения нового материала ввиду частого исполнения одного и того же репертуара, в тяжелой форме - нарастающая утрата координации движений, особенно часто поражающая пианистов), ухудшение физического и душевного здоровья, влияние бытовых условий, наличие вредных привычек - все это негативно влияет на исполнительские качества.
Компьютеры, в отличие от людей, не чувствуют усталости и гораздо менее подвержены влиянию внешних факторов. Вдобавок, успехи информационных технологий во много раз выше, чем успехи в музыке или живописи. Но как вы считаете, наступит ли в ближайшее время такой день, когда общество скажет филармонии: "Все, ребята, можете не приходить, теперь мы будем слушать только сгенерированное нейросетями"? Или художнику заявят: "Мы больше не будем покупать у тебя картины, вот же нейросеть создает шедевры"? Возможно, следовало сформулировать вопрос иначе, но тема остается открытой.