В ноябре прошлого года стало известно, что словом года, по версии знаменитого словаря английского языка Collins, названо AI — аббревиатура, обозначающая искусственный интеллект (artificial intelligence). По сообщению Collins, употребление этого слова по сравнению с 2022 годом выросло аж в четыре раза. Это утверждение легко проверяется самостоятельно, стоит лишь вбить “искусственный интеллект” или английское словосочетание в любой поисковик, ограничив область поиска хотя бы новостями; Google мгновенно выдает 7800 ссылок, так или иначе касающихся популярного запроса.
Косвенные признаки наталкивают нас на подобные выводы: беспилотные автомобили, автоматические доставщики еды, роботы — не декоративно-игрушечные, а гибкие, пластичные, выдерживающие серьезные нагрузки и готовые к изменениям обстановки, сайты, генерирующие вполне убедительные тексты и реалистичные изображения, даже видео — похоже, искусственный интеллект и впрямь стоит у порога. А вместе с ним и все потенциально возможные страхи. Так уж человек устроен, что сперва создает нечто, а потом начинает этого бояться.
И все же существует ли уже полноценный искусственный разум? Преподаватель Школы дизайна НИУ ВШЭ, руководитель “Лаборатории искусственного интеллекта” Вадим Булгаков считает, что делать далеко идущие выводы пока что преждевременно.
— От искусственного интеллекта, каким его описывала научная фантастика, мы еще очень далеки. Если говорить об устройстве, имитирующем работу нейронов в человеческом мозге, то да, нейросеть работает сходным образом. Но по объему операций мы пока и близко не подошли к мозгу, хотя механизм его работы очевиден. Если же размышлять в спекулятивно-м контексте — создали мы искусственный разум или нет, то это вопрос веры: можно верить и в то, что создали, и в то, что не создали. Оба ответа будут верными.
Боязнь чужого
Почему человека пугает ChatGPT? Потому что у нас как у популяции есть некий наработанный в течение пары десятков лет опыт общения с другими людьми в чате. И когда ты общаешься там же с машиной, не чувствуя особо-й разницы, то, по сути, сам решаешь, живое это нечто или неживое. Тот, кто более впечатлителен и более склонен к мистическому мышлению, может расценить поведение ИИ в чате как проявление чего-то живого. Просто потому что оно похоже на что-то живое.
Позвольте, возразит досужий скептик, а в так называемых “умных колонка-х” вроде Алисы или Маруси разве не “зашит” искусственный интеллект? А ведь общаемся с ними, и ничего, не страшно.
— Эти устройства, — говорит Вадим Булгаков, — не настолько очеловечены, чтобы пугать нас. Те, кто занимается разработкой голосовых чатов, специально делают так, чтобы манера говорить той же Алисы или Маруси отличалась от того, как говорит живой человек. На уровне устного общения мы подсознательно чувствуем разницу, понимаем, что это машина, и нам от этого спокойнее. А вот на уровне текста разницу почувствовать не получается! В письменной речи ведь нет интонационных моментов, пауз... Мы не видим разницы между человеком и машиной. Это и пугает.
Если отстраниться от иррациональных страхов и взглянуть на предмет нашего разговора с пытливым интересом, выяснится, что физически мы имеем дело всего лишь с неким комплексом программного обеспечения, работающим на определенной вычислительной мощности. То есть с программным кодом, который делает что-либо. Если говорить про самую, наверное, популярную сейчас технологию GPT, на которой построено большинство актуальных ИИ-чатов, то сама по себе она очень старая и использовалась еще для мобильной связи (помните систему набора текста T9?).
На уровне концепции у нее максимально простой алгоритм: на вход дается несколько символов, и чат пытается предсказать, какой символ должен идти дальше. Проще всего понять на таком примере: если мы услышим начало фразы “Пейте, дети, молоко”, то на автомате додумаем: “Будете здоровы”. Чтобы получить такое окончание фразы, нам требуется “раздражитель” в виде начала фразы “на входе” и набор знаний и опыта. Если же человек не знает фразу целиком, то он придумает какое-то другое продолжение.
Технология GPT работает схожим образом. Исходя из этого, можно объяснить и то, почему GPT может говорить неправду: просто потому, что он создан, чтобы продолжать текст. В том числе и в формате диалога. То есть эта технология создана, чтобы отвечать на вопросы в любом случае. И если готового ответа нет, система впадает в своего рода панику, ведь она обязана ответить, это ее основная цель. Дальше все зависит от подстройки. И, конечно же, изначально в технологию не заложены ни моральные, ни этические критерии.
— Как правило, производитель софта его достраивает, — говорит Вадим Булгаков, — чтобы это выглядело как-то прилично. Хотя бы потому, что, если нейросеть начнет призывать к экстремизму, акции компании-разработчика резко подешевеют. Но существует, к примеру, Stable Diffusion — один из софтов, создающих изображения по текстовым описаниям. У него открытый код, который можно редактировать; блок, отвечающий за цензуру, легко отключит-ь, и тогда от ИИ можно ждать чего угодно.
Проблема создателя
Впрочем, “что угодно” уже происходит. Дипфейки, к которым мы привыкли, из этой же области. Сейчас существует возможность воспроизводить чей угодно голос буквально по трем секундам записи. И такие подделки не обнаруживаются никак: уровень качества сгенерированного звука такой, что мы не можем ни машинно, ни на уровне слуха определить, создано это нейросеть-ю или человеком.
Как считает Булгаков, вопрос здесь не столько технологический, сколько социальный, в плане договоренности людей: как они будут это воспринимать, как будут с этим работать? Как изменится в этих условиях институт репутации, например? И что делать, если любой компромат в теории может быть сделан на коленке умным школьником в его мобильном телефоне? На этот вопрос ответов пока что нет.
Если говорить о генеративных образцах ИИ, создающих изображения по заданным параметрам (Midjourney, Dall-E, Stable Diffusion и пр.), то при работе с ними возникает ряд дополнительных вопросов и проблем. Например, в области авторского права. Технологии сегодня позволяют копировать авторский стиль изображений, фотографий, текста — чего угодно: обучив машину на образцах, можно создавать контент, который будет стилистически максимально близок к оригиналу. Текст, сгенерированный в духе Толстого или Пушкина, получается очень похожим; человек, не знакомый со всем корпусом произведений того или иного автора, но в принципе знающий его творчество, может легко принять его за чистую монету.
Это уже реальность. И о ней сейчас задумываются многие. Так, создатель Microsoft Билл Гейтс, выступая в январе на Всемирном экономическом форуме в Давосе, отметил, что ИИ придется пройти долгий путь интеграции с точки зрения правовых аспектов.
Польза дела
И все же не одними страхами и проблемами жива история с искусственным интеллектом. По мнению Вадима Булгакова, благодаря ИИ человечество стоит на пороге очередной промышленной революции.
— Если смотреть с точки зрения креативного производственного процесс-а, то впервые в истории у человека появился инструмент, влияющий на работу на этапе придумывания. До этого весь прогресс шел в области финальной реализации, автоматизации процессов: ткацкий станок, к примеру, возник, чтобы быстрее производить ткань. А теперь появилась возможность быстрее рождать гораздо большее количество вариантов идеи.
До этого мы были ограничены способностями нашего мозга, а они в рамках популяции плюс-минус одинаковы. И если раньше на процесс придумывания тратилось человеческое время, то теперь с помощью машины мы можем его ускорить. Это значит, что на самом первом этапе поиска решения проблемы произошел невероятный, очень мощный скачок.
Пока что развитие ИИ привело к возникновению новых профессий: так, появился промпт-инжиниринг. Промпт — это набор инструкций, передающихся нейросети, чтобы достичь генерации определенного результата, текстовые команды, на основе которых алгоритм генерирует продолжение текста или создает изображение. Соответственно, промпт-инженер — это человек, который составляет эти инструкции и команды. Булгаков тоже сделал вклад в подготовку специалистов такого рода: под его руководством в Лаборатории искусственного интеллекта создана программа по обучению студентов промпт-инжинирингу и работе с нейросетями.
— Реальность поменялась, новые технологии, как правило, редко откатываются назад, — говорит он, — а значит, необходимо, чтобы студенты могли с этим спокойно работать. Пора привыкать к тому, что теперь это наши рабочие инструменты. К примеру, если мы говорим про цифровой дизайн, то благодаря ИИ можно быстро создавать референсы для обсуждения: если нужно студенту показать то, что преподавателю пришло в голову только что, можно это изображение сгенерировать прямо на ходу.
Или вот пример из другой области: мой товарищ преподает иностранные языки и с помощью ИИ создает уникальные задания для студентов, причем с разбивкой на уровни знания языка! И это не машина студентов учит, она просто помогает преподавателю.
А у него остается больше времени на идеи. Контроль за ситуацией, короче говоря, в любом случае остается за человеком, и в этом цель развития экспертизы — чтобы понимать, хорошо или плохо у машины получилось то, что ей делегировали.
Что впереди?
Искусственный интеллект еще не всеми понят и осмыслен, но уже, с одной стороны, становится пугалом для несведущих, а с другой — серьезным подспорьем для тех, кто воспринимает его не как глобальную угрозу человечеству, а как новый и очень полезный инструмент. Недавно специалисты из Азово-Черноморского филиала Всероссийского научно-исследова-тельского института рыбного хозяйства и океанографии (ВНИРО) на основе методов машинного обучения и искусственного интеллекта разработал-и систему оперативного прогноза благоприятных промысловых районов добычи хамсы в терри-ториальных водах России в Черном море.
А американские исследователи из Microsoft и Тихоокеанской северо-западной национальной лаборатории (PNNL) при помощи нейросетей буквально за 80 часов смогли выявить 23 перспективных варианта новых электролитов для аккумуляторов, в результате чего на основе одного из них был создан работающий прототип.
— Мне кажется, что пока изменений на фундаментальном уровне в ИИ не предвидится. Будут меняться скорость работы, качество результата, не более того. Если мы говорим про генеративные нейросети, то долгое время шла гонка за качеством: раньше часто результатом были довольно странные изображения. А теперь мы, как правило, получаем то, что нас полностью устраивает, и это случилось буквально за пару лет. Значит, на уровне качества достигнута какая-то планка. Можно ли сделать лучше? Можно, но не нужно.
Будет прогресс в области видео. Его генерация идет медленнее, потому что мощностей для нее нужно в разы больше. Более скоростной процессор, больше графической памяти — этого просто надо ждать. Но если раньше картинка была, что называется, “кипящей”, с характерным подергиванием, то теперь есть возможность убирать эти дефекты, и все уже намного лучше выглядит.
Еще одна перспектива ИИ — создание специфических инструментов под те или иные сферы деятельности. Есть нейросеть, которая делает сайты: в их редакторе можно собрать готовый сайт, практически рабочий. То, для чего раньше нанималось несколько человек, теперь делается сервисом с нейросетью. Сейчас все идет именно в эту сторону. И, надо сказать, отношение к ИИ как к чему-то ненужному и вредному меняется.
Это как с фотошопом — внедрили его как инструмент, и в целом нормально же оказалось! Никто не жалуется.