2K подписчиков

Как работают нейросети-художники: никакого творчества, простое ремесло

7,1K прочитали

Что бы там не говорили об искусственном интеллекте, до его изобретения (а тем более обретения им самосознания) ещё очень далеко. Но как же тогда нейросети научились рисовать картины, одной из которых даже дали премию на конкурсе современного искусства? Давайте попробуем разобраться.

Сначала посмотрите на картину и попробуйте сказать - кто её нарисовал?

Что бы там не говорили об искусственном интеллекте, до его изобретения (а тем более обретения им самосознания) ещё очень далеко.

Эта работа называется "Театр космической оперы", она победила в конкурсе изобразительных искусстве и её нарисовала... нейросеть. Как же так - программа умеет рисовать лучше многих людей?

На самом деле DALL-E и другие программ "генеративного ИИ" могут пока лишь создавать изображения, похожие на фотографии, картины или рисунки, созданные людьми. Генеративная нейросеть основана на компьютерной программе, которая сначала разбирает много-много-много картин на элементы, а ищет среди них статистические закономерности.

То, как нейросеть работает, не похоже на естественный интеллект. При этом мы не можем даже предсказать, насколько хорошим выйдет результат. Впрочем, учёные даже не могут толком объяснить, по каким принципам работает такой ИИ. Мы можем только судить, хорошо ли (с нашей точки зрения) выглядят результаты его генерации.

Как нейросеть создаёт картины?

Картина, нарисованная нейросетью. Хорошо или плохо?
Картина, нарисованная нейросетью. Хорошо или плохо?

Не так много лет назад было легко предположить, что технологии ИИ никогда не создадут ничего, что могло бы сравниться по качеству с человеческим художественным сочинением или письмом. Теперь же программы генеративной модели, на которых работает и DALL-E, и чат-бот LaMDA, и другие нейросети создают изображения и слова, которые до жути напоминают работу реального человека. Художественные или фотореалистичные изображения различных объектов и сцен уже сейчас часто сложно отличить от написанных человеком.

Как работают эти модели генерации изображений? Функционируют ли они как человек, и должны ли мы считать их разумными?

Дело обстоит так. Программисты "показывают" программе реальные изображения и описывают их значениями, привычными для людей: собака, картина маслом, банан, небо, диван и т. д. Нейросеть получает огромный объём информации через длинную цепочку последовательных шагов.

В дальнейшем программа немного изменяет изображение, переданное ему на предыдущем шаге, добавляя случайный шум в виде бессвязных пикселей, а затем передает его следующему шагу. Раз за разом, повторяясь снова и снова, исходное изображение постепенно становится статичным, а его смысл исчезает.

Картина, созданная ИИ по запросу "китайская пагода в горах"
Картина, созданная ИИ по запросу "китайская пагода в горах"

Когда этот процесс завершен, ИИ запускает его в обратном порядке. Начиная с почти бессмысленного шума, он моделирует изображение через серию последовательных шагов, на этот раз пытаясь уменьшить "шум" и вернуть картине смысл. На каждом этапе производительность нейросети оценивается так, чтобы менее зашумленное изображение, созданное на этом этапе, имело то же значение, что и исходное реальное изображение.

В то время как размывание изображения — это механический процесс, возвращение к ясности — это поиск чего-то вроде смысла. Модель постепенно «обучается», настраивая сотни миллиардов параметров.

Знакомое изображение?
Знакомое изображение?

Выполняя этот процесс снова и снова на основе многих изображений, каждый раз беря новые параметры, в итоге нейросеть настраивается так, чтобы из набора в целом бессмысленных и несвязных слов взять основной смысл и через серию шагов превратить его в изображение, похожее на те, по которым проходило обучение.

Никакого творчества: работа нейросети по созданию новой картины - это полностью механический процесс, основанный на вероятностных расчетах и огромном числе вычислений, совершаемых с невероятными скоростями.

По сути, программисты превратили творчество в... математику. Процесс работы нейросети заключается в том, чтобы разбить сложные операции на отдельные, более мелкие и простые шаги, которые понятны и привычны любому компьютеру.

Будущее искусства за нейросетью? Пока ещё рано. Или нет, как думаете?