Восстание машин тут как тут: неравнодушная общественность не на шутку встревожена экспансией нейронных сетей. Недавние релизы работ на основе алгоритмов Midjourney и ChatGPD поставили на уши не только технофобов, но и работников креативной индустрии. Пока графические дизайнеры судорожно постят картинки «Нет рисункам от искусственного интеллекта», разбираемся, быть диктатуре нейросетей в ближайшем будущем или нет.
Нейросети в прошлом
Искусственный интеллект в том или ином виде будоражил умы столетия напролет, но до решительных действий дело дошло не так давно. Пионерами в 1943 году стали нейрофизиолог Маккаллок и математик Питтс, которые представили статью с упрощенным описанием, как друг с другом взаимодействуют нейроны в человеческом мозге.
В 1958 году американский нейрофизиолог Фрэнк Розенблатт придумал перцептрон — компьютерную модель, наглядно иллюстрирующую, как наш мозг воспринимает информацию. На схеме датчики передавали сигналы ассоциативным и далее реагирующим элементам, таким образом связывая исходные стимулы и необходимую реакцию на выходе. На основе модели перцептрона энтузиаст создал компьютер Марк I.
Модель перцептрона показалась последователям Розенблатта ограниченной: на этом фоне интерес к нейронным сетям ненадолго угас, но спустя время возродился из-за резко возросших вычислительных мощностей компьютеров. С 1975 года информатики придумывают методы обучения нейросетей.
Тотальный ренессанс нейросетей пришелся на 2010-е годы: существенно увеличились объемы обучающих алгоритмы материалов, параллельно появилось «железо» (компьютерные составляющие), которое позволило с этими объемами работать. В авангард вышло компьютерное зрение: тренировать нейросети стало возможно на огромных массивах изображений баз вроде ImageNet. Важно, что на всех картинках присутствовала разметка — заданное человеком описание, которое прилагается к изображению и кратко его резюмирует. Например, для фотографии кошки адекватным вариантом разметки может быть запись: «кот, количество — один, животное». К слову, надоедливые надписи на сайтах с призывами вроде «Найдите все изображения с самолетами» — еще один способ генерации разметки, дающийся специалистам по машинному обучению вашими кровью и потом.
Прогресс компьютерного зрения был громким: последовала череда инженерных успехов крупных команд (Deepmind от Google, Microsoft), институтских лабораторий и маленьких проектов. Вслед подтянулось моделирование текстов: появилась архитектура трансформеров, которая позволила генерировать изображения по тексту. Со временем такие модели научились блестяще воплощать «смыслы» текстовых строк — так популярность в их нынешнем виде снискали Midjourney и DALL-E.
Нейросети сейчас
Сегодня нейросети правят бал: отвечают за поиск, накладывают на фото фильтры, не всегда успешно заменяют собой операторов колл-центров на телефоне. Обучением нейронных сетей занимаются специалисты по машинному обучению: так, обычно в каждой крупной IT-компании есть отдел с виртуозными дрессировщиками искусственного интеллекта.
Заметным инфоповодом, внесшим сумятицу в ряды креативщиков, стало увольнение 180 сотрудников крупнейшим интернет-СМИ Buzzfeed в декабре 2022 года. С места под солнцем ответственных за контент потеснил чат-бот ChatGPD — продукт компании OpenAI, который производит складные пассажи на разных языках. Психотическим настроениям в январе поддался и колумнист The Guardian: он сетовал, что ChatGPT всего за 30 секунд написал статью по маркетингу, которую автор вымучивал бы часами. Наконец, недобрые предчувствия усиливает оглушительный прецедент из недалекого прошлого: в 2021 году в Лондоне была поставлена пьеса, написанная искусственным интеллектом. Выходит, лавры Шекспира под угрозой?
Но страдают не только писатели: так, вышеупомянутая Midjourney наделала шума в среде коммерческих художников. Началось все с ежегодного художественного конкурса в Колорадо, куда с картиной «Theatre D’opéra Spatial», смастеренной пресловутой нейросетью, заявился инженер и художник Джейсон М. Аллен. И наперекор всему выиграл. Разумеется, на Аллена с разгромной критикой тут же обрушились завсегдатаи Reddit и Twitter. Особенно шумно вели себя digital-творцы, чьи опасения не безосновательны: зачем платить фрилансеру сотни долларов, когда за минуту можно обрести новое «Рождение Венеры» на цифровом блюдечке?
В ответ на нейросетевой триумф интернет запестрел исповедальными манифестами. Так, фрилансер Эбен Шумахер опубликовал на своем сайте статью «Заменит ли искусственный интеллект художников?» Шумахер — добросовестный участник движения «No To AI Generated Images» («Нет рисункам от искусственного интеллекта»), и его прогноз эсхатологичен: несмотря на оптимистичные суждения, что в будущем человек сохранит за собой статус творца и будет курировать работу нейросетей, цифровые художники обречены. В лучшем случае «человеческое» творчество займет нишу хенд-мейда и будет чем-то вроде диковинки для коллекционеров и прочих экзальтированных, да и то не факт.
Нейросети в науке
В середине бушующего океана паранойи вернемся обратно к теории. Так, искусственная нейросеть — это компьютерная программа (вроде «Тетриса» — хоть обычно ее и изображают как набор соединенных между собой нейронов), преобразующая входные данные с помощью различных математических функций, набор и параметры которых устанавливаются на этапе построения и обучения. При этом данные на вход подаются оцифрованными: например, картинка как координаты точки на экране с кодом цвета. Грубо говоря, вводный параметр проходит некоторые метаморфозы, после чего математический аппарат «выплевывает» его обратно.
Нейросеть — не алгоритм в обычном понимании слова (как, например, когда мы рассказываем бабушке, как отправить СМС), а обучаемая на ограниченном датасете (предзаданном наборе данных) процедура. Поэтому однажды обученная нейросеть по большей части предопределена своим датасетом и алгоритмом обучения. Конечно, иногда она выдает непредсказуемые результаты за пределами своей выборки, но точно не превратится в deus ex machina и вызовет шквал насилия лишь тогда, когда корги, ошибочно стилизованная под Эдварда из «Сумерек», вызовет негодование у поклонников Джейкоба.
Другой стоп-фактор заключается в том, что нейросеть традиционно обучают под конкретные задачи, то есть алгоритм, «натасканный» на распознавание лиц, не сможет обнаружить на фото, например, стулья. Пока что все нейросети подвержены так называемому катастрофическому забыванию: оно приводит к тому, что при смене задачи обретенный до этого навык по предыдущей полностью теряется. Поэтому до сложного абстрагирования, сравнимого с человеческим, искусственному интеллекту далеко: та же Midjourney пишет картины, основываясь не на представлениях о прекрасном или канонах жанра, а посредством активной имитации. В общем, «Фонтан» Дюшана нейронка вам не слепит — с рафинированными смыслами у нее туго.
Вопрос возможности существования «сильного» искусственного интеллекта (такого, который мог бы обосновывать и решать проблемы, а также осознавать и мыслить себя как отдельную личность) активно обсуждался философами и когнитивными психологами. Одним из самых популярных аргументов против существования такого искусственного интеллекта стал мысленный эксперимент «Китайская комната», опубликованный в 1980 году американским философом Джоном Серлом. Если упростить: человек, не знающий китайские иероглифы, но экипированный соответствующей инструкцией, способен выложить осмысленную последовательность иероглифов, и при этом наблюдатель со стороны не заподозрит неладного. Аналогично, по мнению Серла, действует и искусственный интеллект: не обладая сознанием, умело имитирует рациональное поведение.
Кроме того, использование искусственного интеллекта в генерации текстов и изображений имеет этические издержки, что делает вопрос с дальнейшим внедрением нейросетей в бизнесе чувствительным. Так, алгоритм обработки естественного языка GPT-3 от Open AI неполиткорректно ассоциирует слово «ислам» со словом «терроризм», а местоимения женского пола — со словом «непокорный». Еще более разрушительный потенциал несут сети вроде Dall-E и той же Midjourney, способные генерировать изображения по текстовому запросу, — едва ли кто отважится совладать с потоком журналистских уток и фейковых фото в случае, если нейросеть пустят в свободное плавание. В общем, повторяется судьба овечки Долли: технологически сладкий плод имеет все возможности со временем стать запретным.
Нейросети в будущем
Дискуссия о столкновении новоизобретенных и ортодоксальных технологий не нова: похожая общественная истерика уже случалась по поводу, например, живописи и фотографии. Известный поклонник абсента, поэт и искусствовед Шарль Бодлер принял в пику изобретение фотоаппарата и называл фотографию «главным врагом искусства». Аналогично в начале ХХ века технопуристы оценивали программы компьютерного редактирования — те якобы требовали слишком маленькой квалификации от исполнителей.
На повестке дня у нейросетей — масштабный прогресс в сфере визуала: так, в скором времени обученный алгоритм сможет возместить креаторам львиную долю манипуляций в Photoshop посредством «умных фильтров». Параллельно специалисты машинного обучения заняты постепенным улучшением качества генерации через текстовые подсказки, которые позволяют более точно продуцировать изображения по тексту. Более общие предсказания касаются способности нейросетей решать за людей. Например, в прошлом директор по развитию «Яндекса» Григорий Бакунов считает, что алгоритмы можно использовать «практически везде, где принимаются не слишком интеллектуальные решения живым человеком».
Экономические пророчества по поводу будущего нейросетей расходятся: так, в 2019 году представители McKinsey со смаком предрекали потерю 45 миллионами американцев работы из-за роботов к 2030 году. Более жизнеутверждающее видение ситуации у сооснователя нейросети Sudowrite Амита Гутпы: он считает, что продукт не потеснит специалистов на рынке, а новая технология дополнит наши возможности в сфере написания текстов. Финансовые и спортивные отчеты, правда, все-таки пустят под нож — «слишком механические».
Кажется, что история страдает от самоповторов, а человек всегда остается собой. И если изобретение ткацкого станка успело добавить ручной работе желанности, по поводу нейросетей нет смысла переживать — если однажды попросили за дверь из райского сада, все кровавые тяжбы с искусственным интеллектом уже нипочем.