Компания Nvidia на недавнем GDC представила много любопытных штукенций, но из всего этого разнообразия хочется выделить демку, показывающую, как интегрировать искусственный интеллект в игры. Nvidia сделали работу в сотрудничестве с другой компанией, есть дополнительные подробности об этой работе, но не станем на них фиксироваться.
Ведь для геймерского сообщества хочется узнать, чем является разработка Covert Protocol как таковая. Кратко возможно сказать, что нейросети теперь возможно зашивать прямо в игровых персонажей. Благодаря этому NPC могут более вариативно с вами общаться и, более того, обучаться на основе ваших ответов и реакций. Игровой опыт становится гораздо более реалистичным. Если продолжить рассуждать, то такой игровой опыт становится почти копией реальности.
Ведь, несмотря на разнообразие возможностей в жизни, большинство людей использует довольно ограниченный набор, начиная от заученных стандартных фраз и заканчивая набором типичных действий. Конечно, вы можете сказать, что свободен ваш разум и вы можете делать стандартные действия, но вот в уме.. Однако, ведь и в игре вы тоже можете делать самое разное у себя на уме, но вот игровой мир ограничен заданными условиями.
Иными словами, игры с интегрированным в NPC ИИ станут похожи на реальный мир больше чем кажется. Конечно, также игры останутся и вариантом фантазии, благодаря наличию приключений и условности мира, в котором отсутствует смерть и все происходящее понарошку, ведь перед вами игра. Тем не менее, взаимодействия с NPC станут похожи на ваш реальный опыт взаимодействия с другими людьми в социуме. Особенно, в ситуациях, когда есть социальные условности.
Старушка и Алиса
В одном фантастическом рассказе (не припомню автора, какой-то популярный японский фантаст) герой рассуждает о странности взаимодействия с телефонами. По сюжету рассказа у всех в мире будущего есть видеосвязь, но для получения абонентского номера требуется пройти серьезный ценз на уровень достатка, привлекательный вид и подобное. Ведь в новом мире каждый на виду и будто ведёт собственный стрим, поэтому стримить с абонентским номером видеосвязи допускают только приятных и правильных людей.
Речь однако не об этом, а про рассуждения героя касательно коробочки телефона. Автор устами героя озвучивает, казалось бы, понятную мысль, над которой не часто думают: а с кем мы говорим? Телефоны стали привычными, но ведь само действие говорения в небольшую коробочку, кусочек чего-то, кажется странным. Конечно, мы говорим как бы с человеком, но при этом ведь говорим с телефоном, в странную коробочку, которую буквально отождествляем с другими людьми. Если немного выйти за привычное восприятие, становится заметным, что такое поведение выглядит странным.
Недавно видел короткое видео (не уберёг меня боженька от просмотра ютубных шортсов и, печально признавать, но зависимость от этого 💩 похоже, хреновее табачной) где старушка говорит с приставкой Алиса про советские песни, говорит, как с живым человеком и рассказывает, как в советские времена эти песни слушала и какие нравились. Причем старушка не то что без признаков деменции, а, знаете, такая вдумчивая, приятная, интеллигентная. И вот вежливая старушка, вежливо общается с Алисой.. коробочкой приставки..
Конечно, здесь возможно сказать, что это я - тупой, ничего не понимаю, а старушка в тренде и конкретно врубается.. да и все теперь с Алисой говорят. Тезисы, безусловно, дельные, однако, вопрос остаётся: с кем мы говорим? С кем говорит эта старушка, с кем предлагают говорить игрокам в демке Nvidia?
ИИ для игровых NPC by Ubisoft
Кстати говоря, не только Nvidia оживляет общение NPC, но и Юбики лезут в тему. Понятное дело, что лезут на запах денег, а также, как и полагается Юбикам, хотят всё запарфозить. Ну а чё? Должны ведь быть в мире такие, кто всё парфозит, так ведь?
Ubisoft показали свои разработки тоже на конференции, на GDC. И тоже работали с другими компаниями и партнёрами, для того чтобы сделать итог. Этим итогом стала технология NEO NPC, то есть, как минимум, имя избранного из Матрицы они с самого начала запарфозить смогли.. представьте, какое восхищение вызовет остальная часть разработки 🙂
Итак, если кратко, то значительную часть берут вообще из озвученной разработки Nvidia. Для лицевой анимации по аудио используют Audio2Face от NVIDIA, для содержания берут разработку Inworld (с которыми NVIDIA, собственно, и делает Covert Protocol) остальным занимается особый отдел в Ubisoft Paris.
Особенность здесь заключается в том, что персонажа NEO NPC делает сценарист. Соответственно, некий чел буквально делает что-то наподобие рассказа про персонажа и "кормит" ИИ всякими параметрами и данными про заданную личность. Кормёжка идёт до того этапа как ИИ (языковая модель) начнет импровизировать, то есть получит такой объем данных и настроек, которые позволят быть NPC живым. В той, конечно, степени, в которой NPC могут таковыми быть.
Возвращаясь к нашему вопросу (с кем мы говорим?), здесь говорим не только с ИИ, но и с неким отпечатком автора персонажа, а также, конечно, с общими нарративными ограничениями, ведь в NEO NPC предполагается, что каждый персонаж, несмотря на некоторую свободу общения, выполняет собственную сюжетную роль, которой следует, а также не реагирует на некоторые провокационные или кардинально отклоняющиеся от игрового мира фразы. В общем, также как и с таксистом или продавцом, вы можете поговорить почти обо всем, но не выходя за пределы условного набора скриптов.
Мелани Лопес Мале (Mélanie Lopez Malet), которая занимается разработкой NEO NPC, недавно заявила, что для создания действительно фактурных героев потребуются люди-актеры, то есть ну не могет тупая кремниевая железяка сделать Сильверхенда также круто как Киану Ривз, не могет.
С кем мы говорим?
Довольно давно пробовал Яндекс.Толоку и там было много заданий по обучению Алисы. Как известно, chatgpt обучали по кабальному аутсорсу в африканской, кажется, стране, где толпы нищих сотрудников пытались обучить языковую модель различить токсичность и проявлять деликатность. Наверное, когда говорим с Алисой или chatgpt, в некоторой степени, слышим в них также и голоса тех самых людей, которые их обучали. Когда говорим с ИИ NPC, можем заметить автора этой модели или говорить, по сути, сами с собой. Однако, возможно ведь люди и так, общаясь друг с другом, чаще всего говорят только сами с собой и не часто реально другого слышат и, тем более, понимают. Тогда в чем разница между общением с ИИ NPC, который предоставит идентичный спектр переживаний и опыт речевой активности?