В последнее время в связи с работой над одним проектом, возникла необходимость погрузиться в тему генерации изображений при помощи нейросетей и вот теперь пришло время поделиться с Вами своими наблюдениями и выводами.
Реакция людей на нейросети выглядит достаточно полярной, одни видят в них опасность и пытаются протестовать и запрещать, другие возможности и стараются оседлать эту шальную кобылку.
Начнём с первого, было странно услышать об опасности нейросетей от режиссеров монтажа, мол скоро они всех нас заменят. Хотя им то как раз нейросети никакой опасности не представляют, более того на данном этапе они забирают у них рутинную и неинтересную работу, например удаление шума в звуке и мэтчинг кадров по цвету. Эти возможности мы уже имеем в Adobe Premiere.
Для игровых режиссеров монтажа никакой опасности нет, потому что нейросети не могут и вряд ли смогут определять тонкости актерской игры и разбираться в эмоциях актеров и на основе этого совмещать кадры друг с другом. А вот рутинные задачи типа расшифровки текста, логирование материала, определение актеров в кадре и каталогизирование материала по лицам в кадре уже можно делать в DaVinci.
Но сначала надо определиться что такое нейросети, и чем они отличаются от программ. Если коротко, то программы пишутся программистами, нейросети обучаются. В первом случае программам объясняются правила взаимодействия объектов, во втором просто закидывается массив данных и они ищёт в них закономерности. Это немного черный ящик и чем то похоже на то как дети учат первый язык, они наблюдают за родителями и ищут закономерности в издаваемых звуках и происходящих действиях. Изучение второго языка уже больше похоже на программирование, а первого именно на обучение нейросети.
Сейчас взрывной рост испытывают нейросети генерирующие изображения MidJourney, Stable Diffusion и другие. Какую опасность и для кого несут они? Ну конечно для цифровых художников и фотобанков. Но говорить что скоро они их всех заменят, очень самонадеянно и глупо.
Это естественный и закономерный процесс, и с ним глупо и невозможно бороться, борись не борись всё равно будет так как будет. Его можно сравнить с появление цифровой фотографии. С одной стороны появилось огромное количество фотографов с цифровыми зеркалками, которые стали делать кучу контента, и в то же время фотолаборатории и производители плёнок стали не нужны ( тут надо оговориться что *в таких количествах не нужны) и тоже было много криков, что скоро мы все умрем и это криворукая молодежь вытеснит "старых профессионалов". Однако прошло время, и профессионалы перешли на цифровые камеры, пленочные лаборатории стали уделом эстетов, но они остались, а количество фотографий, фотостудий и фотографов вырос в разы. Просто сам рынок вырос и по части спроса и по части предложения. Точно то же самое было с развитием цифрового монтажа и так далее. Когда что то становится доступно всем, рынок испытывает взрывной рост.
То же самое будет и с изображениями. Ведь все равно художников нужно много, нужно рисовать книги, обложки, рекламу, придумывать персонажей для фильмов, для игр, да всего не перечислить. А нейросети выдают пока то, что им угодно, и потом появляется заказчик и говорит "что то на нашего персонажа не похоже, и уши не те, и нос кривой и шерсть должна быть темнее". И это по любому надо уметь потом допиливать лобзиком в фотошопе своими ручками. Поэтому художникам надо будет перестроиться, чтобы выдавать больше результата в меньшее время, надо научиться пользоваться нейросетями и допиливать их лобзиком.
Поэтому не надо искать упираться в опасности, с ними ничего не сделать, надо видеть возможности. Можно отдать отрисовку фонов, создание разных версий одной картинки или персонажа, позировку, фазовку и прочую скучную работу нейросетям.
Для нехудожников нейросети открывают огромные возможности по созданию контента, по сути сейчас нейросети заменят фотостоки, где вы создаете запрос, что вам нужно и получаете картинку свободную от авторских прав, и вы можете пользоваться ей так как вам удобно.
Фоны, текстуры, готовые дизайны. Но в то же время они не заменяют вам старых знаний и навыков, которые вы получили или которые получаете сейчас. Нейросети не заменят Photoshop, Premiere, DaVinchi, After Effects, Cinema 4D или Blender, но они их могут дополнить и ускорить работу. Ведь определённую часть работы занимает поиск нужных ассетов, и насколько ускорится работа, когда вместо поиска мы сможем сгенерировать нужную текстуру, а вместо написания письма художнику с запросом на фон, мы можем написать promt в MidJourney и через пару минут попыток и генераций получить нужный вариант.
Какие это возможности для видеомейкеров? Ну это конечно же новые визуальные эффекты.
В 2008 году вышел фильм "Помутнение" с Кеану Ривзом, там отснятый видеоряд тысяча китайцев вручную обрисовывала в течении пары лет.
Теперь эту задачу можно отдать нейросети и она её решит для вас. И теперь такой видеоряд может создать каждый не используя тысячу китайцев.
Да есть ещё проблема с консистентностью, то есть пока ещё сгенерированное видео выглядит не как видео, а как последовательность сгенерированных картинок.
Но это проблема решаемая и сгенерированный арт уже вовсю пролез в музыкальные клипы. А эти ребята всегда первыми хватают то, что выглядит красиво.
На этом пока всё, в следующих статьях буду делиться тем, что удалось узнать и в чём разобраться. Если не согласны и хотите поспорить высказывайтесь в комментариях.
Спасибо за внимание!
Всех Благ!