2022 год — это год нейросетей. И в 2023 году они тоже будут на слуху. Сейчас происходит какой-то бум в этой теме и этот бум напоминает эпоху криптовалюты. Столько обзоров, статей и т.п. стало появляться на просторах интернета. Если раньше (лет 10 назад) о нейросетях знали только специалисты, которые непосредственно занимаются этой темой (или те люди, которые просто активно интересуются ею), то сейчас нейросети врываются и в жизни обычных людей. ChatGPT, Midjourney, Stable diffusion, EbSynth и еще огромный список различных нейронок стали доступны для каждого. Я, как человек с образованием программиста; как человек, который создавал самостоятельно простые игры, основанные на нейросетях; как человек, тестировавший некоторые современные нейросети, хочу ответить на несколько вопросов (в первую очередь для себя):
-Настолько ли хорошо работают нейросети?
-Заменят ли они людей и как скоро это произойдет?
-Как применять нейросети в сфере Motion Design?
Настолько ли хорошо работают нейросети?
Я буду рассуждать только о тех нейросетях, которые доступны для пользования обычным людям. Есть много нейросетей, которые действительно работают великолепно. Например, нейросеть, занимающаяся распознаванием лиц. Но с доступными нейросетями все не так радужно. Давайте разберем конкретные примеры:
1. Stable diffusion. Я тестировал ещё и Midjourney (у них примерно одинаковый функционал), но Stable diffusion мне приглянулся больше (как минимум по той причине, что там нет ограничений по количеству запросов).
-Первая проблема: надо выполнить очень много шагов только чтобы установить эту нейросеть себе на компьютер. Перейдя по ссылке вы можете ознакомиться с алгоритмом. Мы в России народ ленивый. И увидев такую длинную портянку текста в инструкции, многие могут отказаться от идеи работы с нейросеткой уже на этом этапе.
-Вторая проблема: если вы хотите просто поиграться с данным инструментом, то он отлично выполнит роль игрушки и развлечет вас, но если вы хотите получить конкретный результат, то вам придется попотеть. Вам нужно задать корректный запрос, покрутить различные настройки перед генерацией. В итоге только спустя итераций 100 вы можете добиться от нейросетки желаемого результата. Я видел много роликов, где блогеры довольно таки быстро добивались желаемого результата, показывая, какой классный инструмент эти нейросети. Но готов поспорить, что в видео показаны только конечные результаты и не показано, как долго они мучались, "крутя" различные настройки. Я за все время работы с данной нейросетью ни разу не добился более менее хорошего результата. Это, конечно, не отменяет того факта, что я могу быть криворуким, но и все же доказывает, что с нейросетью нужно уметь работать. И нужно учиться работать с ней.
-Третья проблема: баги. Например, я столкнулся с таким багом: я нашел очень большой запрос (промт) в интернете, который должен был сформировать мне картинку, но моя нейросетка просто выдала мне ошибку. И проблема в том, что после часа ресерча я так и не нашел ответ. Т.е. проблема в том, что в интернете маловато информации о том, как бороться с ошибками, что делает работу с нейросетями проблематичной. P.S. Если вы знаете, в чем проблема, напишите в комментариях.
2. Нейросеть от Adobe (ссылка). Ее суть в том, что она позволяет классно обрабатывать запись с какого-нибудь диктофона так, что кажется, будто запись сделано на более менее нормальный микрофон. Я делал большую ставку на эту нейросетку и я достаточно вовремя о ней узнал, так как я начал вести блог на youtube и мне хотелось, чтобы голос в туториалах звучал более профессионально с точки зрения качества. И по началу мне показалось, что нейросеть работает хорошо. Оценить вы можете, посмотрев вот этот туториал у меня на канале. Но когда я начал готовить следующие ролики, то начал замечать все нюансы: голос становится роботизированный, некоторые слова "проглатываются". Пример плохой обработки можете послушать, перейдя по ссылке. Это часть озвучки для данного ролика. В итоге я делаю вывод, что нейросети могут сделать качественно работу, но для этого придется приложить достаточно много усилий и встает вопрос, а стоит ли прилагать эти усилия?
Заменят ли они людей и как скоро это произойдет?
Однозначно ДА, заменят. Это будет похоже на тот период, когда машины и роботы заменили людей на заводах, тем самым лишив их работы. Но есть и обратная положительная сторона: нужны будут люди, которые должны обсуживать нейросетки. С учетом развития технологий произойдет это, я думаю, в течение 10 лет, если мы все не станем радиоактивным пеплом.
Как применять нейросети в сфере Motion Design?
Мой блог все же про Motion Design, поэтому я хочу привести примеры, как сейчас можно использовать нейросети в данной сфере.
1. Замена стоковых сайтов с изображениями (для видеоряда можно будет подбирать уникальные картинки и причем бесплатно).
2. Создание концептов роликов.
3. Наложение эффектов. Пример по ссылке.
4. Анимация персонажей с помощью камеры телефона/веб-камеры и программы Rokoko
5. Создание эксперешенов для анимации. Примеров не нашел, но есть пример, где ChatGPT писала код для игры на Unity. Поэтому думаю, что нейросеть справится и с экспрешенами.
В итоге можно сделать вывод, что нейросети уже сейчас могут быть хорошим вспомогательным инструментом для специалистов (в частности в Motion Design), но на данный момент нужно уметь с ними работать и не ожидать невероятных результатов. Я уверен, что нейросети сделают своего рода революцию в индустрии и произойдет это относительно скоро. Остается лишь ждать и погружаться потихоньку в тему, так как умение работать с нейросетями будет одним из важнейших навыков в работе современного специалиста (как сейчас навык работать с компьютером).
Ссылки:
1. Канал на youtube: ссылка
2. Поддержать канал: ссылка