Айрат Нурутдинов о том, как Microsoft превращает искусственный интеллект в новую нефть
Извечная надежда человечества на возвращение в библейский рай теперь концентрируется в сфере ИИ. Лучшие умы всегда посвящали свою жизнь созданию интеллекта, способного превзойти самих творцов, но именно сейчас появились первые проблески возникновения GAI (общего искусственного интеллекта) — программы, способной выполнять любую интеллектуальную «человеческую» задачу. Но путь в рай тернист и далеко не факт, что мы движемся в правильном направлении, особенно когда поводырями становятся транснациональные корпорации, предупреждает гендиректор «Таттелекома» Айрат Нурутдинов. В своем блоге для «БИЗНЕС Online» он объясняет, почему президент США Джо Байден неожиданно собирает у себя всех разработчиков ИИ и как нейросети на глазах переходят в новую ипостась.
Новое амплуа искусственного интеллекта
В начале мая президент США Джо Байден собрал у себя сразу всех ключевых лидеров разработки искусственного интеллекта: Microsoft, Google, OpenAI и Anthropic — компании, основанной выходцами из OpenAI. Встреча получилась беспрецедентной и по составу участников (кроме глав корпораций, на ней присутствовали с десяток высокопоставленных чиновников, включая вице-президента Камалу Харрис и советника по нацбезопасности Джейка Салливана), и по повестке дня. Члены правительства, как отмечается в каждом из четырех (!) релизов Белого дома, посвященных этому событию, «поделились опасениями по поводу рисков, связанных с искусственным интеллектом», а сам Байден «приехал, чтобы подчеркнуть, что компании несут основную ответственность за обеспечение безопасности своих продуктов до того, как они будут развернуты».
В тот же день Microsoft открыла доступ к Bing Chat AI для всех, отменив листы ожидания. Теперь пользователям достаточно учетной записи Microsoft (на территории России сервис доступен только через VPN), чтобы воспользоваться открытой версией чата на основе GPT-4.
Эти два события — индикатор того, что искусственный интеллект перешел в новую ипостась. Из игрушки, которая забавно отвечала на вопросы и рисовала красивые картинки, он становится мощным инструментом, приоритетным для американских властей (один из результатов встречи — инвестирование еще $140 млн в создание 7 центров по ИИ по всей стране) и де-факто пока сосредоточенным в руках одной транснациональной корпорации.
1000 и 1 GPT: настоящий ли подсунут вам?
В последние несколько месяцев в интернете появилось огромное количество платных и бесплатных сервисов, заявляющих, что используют ChatGPT, GPT-3.5, а то и GPT-4 или и вовсе GPT-5. Но обещания эти далеко не всегда совпадают с реальностью. Поясню почему.
Все вышеперечисленные решения разработаны компанией OpenAI, в которую Microsoft еще в 2019 году инвестировала $1 млрд, а в 2021-м — еще $2 миллиарда. Это позволило бывшему стартапу работать на суперкомпьютерной платформе на базе Azure (входит в топ-5 самых производительных в мире). В январе Microsoft заявила, что Azure продолжит выступать в качестве эксклюзивной платформы для OpenAI и объявила о новых многолетних инвестициях (как пишет Bloomberg, до $10 млрд).
Microsoft действительно предлагает сторонним компаниям решения по созданию на базе Azure OpenAI-чатов с использованием моделей ChatGPT и GPT-4, но платно. Так что, используя многочисленные чат-боты, стоит задаться одним из двух вопросов: если услуга бесплатная, то почему мне кто-то разрешает пользоваться этим бесплатно; а если платная, то настоящий ли это ChatGPT и GPT-4?
Когда вы пользуетесь чат-ботом самого Microsoft, Bing, то ответы на эти вопросы понятны — корпорация собирает о вас данные и показывает скрытую таргетированную рекламу по вашим запросам. Так делают все коммерческие поисковики, а платят за это продавцы услуг и товаров. Мы, как коммерческая компания, действуем аналогично, у нас довольно ощутимые затраты на «Яндекс.Директ», а раньше были и на Google Ads.
Над собственной языковой моделью работает и Google, на своей конференции 10 мая компания пообещала поддержку русского языка и доступ для пользователей в 180 странах (но не в России), о попытках создания своего аналога заявляют и в Китае. В конце апреля Сбер анонсировал собственную мультимодальную версию нейросети, но пока она на этапе закрытого бета-тестирования. Так что сейчас безоговорочный лидер — Microsoft.
Microsoft в GPT открыла новые «нефть» и «газ»
ChatGPT — это технологический прорыв в больших языковых моделях (LLM). Это совершенно неожиданное воплощение мечты человечества о сверхсуществе, которое аккумулировало все общедоступные знания и способно делиться ими в диалоге. Но, как это часто бывает с такими величайшими изобретениями, как, например, книгопечатание, электричество и интернет, они медленно пробивают дорогу к умам, сердцам и, главное, кошелькам людей. Более того, есть вероятность, что могут застрять где-нибудь на начальном этапе и долго ждать, когда представится новый шанс, тем более что GPT — это не общедоступная для повторения технология, а эксклюзив одной компании.
По сути, это совершенно новый инструмент и новый опыт для пользователей, а значит, каким бы он ни был хорошим, мы не можем сразу начать им эффективно пользоваться. Это своего рода велосипед, коньки или, если хотите, горные лыжи: для тех, кто уже научился пользоваться, это прекрасные спортивные снаряды или вообще транспортное средство, а для тех, кто только осваивает, –- риск получить серьезные травмы. При этом текущие редакции GPT еще далеки от совершенства. Пока это подобие велосипеда самой первой конструкции — с большим передним колесом, чтобы больнее падать. Новый сервис интеллектуальных ответов подразумевает соответствующие вопросы, мы часто не умеем их задавать, нас отучили от этого еще в школе. Именно по этой причине симбиоз с поисковиком — прекрасная возможность быстро получить огромную армию пользователей с минимальной фрустрацией.
Так что интеграция GPT-4 в поисковик Microsoft, возможно, не только наконец-то даст возможность Bing догнать Google, но и позволит сотням миллионов пользователей овладеть новыми навыками, приучит их активно обращаться к сервису, определит предпочтительные модели использования, ну и соберет о нас данные для GPT-5. А платить за это будет обычный бизнес, т. е. рекламодатели. А в конечном итоге и мы с вами — путем выбора и покупки очередного, не всегда нужного, товара или услуги с бо́льшей наценкой. Кроме того, уникальные возможности работы GPT с текстом позволят Microsoft вернуть пошатнувшиеся в сторону инструментов Google позиции MS Office, а также захватить огромный рынок стоковых фотографий и изображений, а со временем — и видеоклипов.
Конечно, это не единственная, но, на мой взгляд, основная модель монетизации, т. к. она позволяет приобщить к сервису максимальное количество пользователей.
Интересно и довольно неоднозначно на этом фоне выглядит открытая международная петиция с «призывом ко всем лабораториям ИИ немедленно приостановить как минимум на 6 месяцев обучение систем ИИ, более мощных, чем GPT-4». Похоже, реальной целью петиции было создание информационной повестки с целью побудить правительство ввести ограничения на использование ChatGPT в своих странах. Первой стала Италия, правда, запрет продержался чуть меньше 30 дней. Дальше последовала забастовка гильдии американских сценаристов (одно из требований которых — ограничить использование ИИ в создании сценариев), которая уже привела к остановке производства нескольких крупных кинопроектов.
Microsoft же продолжает прилагать огромные усилия для закрепления на новом рынке и захвата пока еще «голубого океана». Билл Гейтс в своей программной статье «Эпоха искусственного интеллекта уже началась» завуалированно намекнул на несколько последствий распространения ИИ. Например, что продолжается вытеснение людей из сфер интеллектуальной деятельности, не требующих постоянного обучения. Если вдуматься, это серьезная угроза. Так, у человека сегодня главное преимущество перед ИИ в том, что он может сравнительно быстро учиться новому. Беда в том, что люди не хотят этого делать и, вероятно, в этих условиях будут терять свои позиции. Буквально на днях корпорация IBM уже объявила, что готовится заменить искусственным интеллектом 7,8 тыс. рабочих мест.
При этом Гейтс считает, что ни один из прорывов последних месяцев не приблизил нас существенно к сильному (общему) ИИ. Искусственный интеллект по-прежнему не контролирует физический мир и не может устанавливать собственные цели, а значит, не представляет самостоятельной угрозы. Ведь нельзя забывать, что при всей важности интеллектуальной деятельности основа 90–95% нашего мира — это физические движения, которые ИИ пока не может воспроизводить. Но как только появится такая технология, все изменится куда более драматично, чем с запуском ChatGPT.
Нейросетевой апокалипсис откладывается? OpenAI приостановила разработку GPT-5
OpenAI сегодня — это новая Tesla, SpaceX и Starlink, вместе взятые. Компания была создана в 2015 году Илоном Маском, соучредителем LinkedIn Ридом Хоффманом, Питером Тилем, Грегом Брокманом и технологическим инвестором Сэмом Альтменом.
Команда формировалась неслучайно: Брокман на старте встретился с Йошуа Бенжио, одним из «крестных отцов» искусственного интеллекта, и они составили список лучших исследователей в этой области. 9 из них согласились участвовать в OpenAI. И, очевидно, не прогадали: по словам главы Microsoft Research Питера Ли, стоимость ведущего исследователя ИИ сегодня уже превышает стоимость перспективного защитника NFL. В январе 2023 года OpenAI вела переговоры с инвесторами о продаже своих акций, исходя из оценки всей компании примерно в $29 млрд, писалаThe Wall Street Journal со ссылкой на осведомленные источники.
В развитии OpenAI было несколько поворотных моментов. В 2018 году Маск решил, что OpenAI отстает от других игроков, таких как Google, и предложил передать ему управление OpenAI, но совет директоров отклонил эту идею. Тогда он просто ушел из компании. Насколько сейчас Маск жалеет о принятом решении, можно судить по регистрации им на днях новой компании в области искусственного интеллекта X.AI, которая по замыслу должна стать конкурентом OpenAI.
Изначально, напомним, OpenAI (название дословно переводится как «открытый искусственный интеллект») учреждалась как некоммерческая организация для проведения исследований в области искусственного интеллекта. Она заявляла, что будет создавать продукты для всех, публиковать свои работы в виде статей и программного кода, а патенты будут доступны всему миру. Первоначально OpenAI действительно вела открытую политику, выкладывая как подробные статьи, так и полный код моделей. Например, в конце 2019 года она выложила в открытый доступ код всей линейки моделей GPT-2 с довольно подробным описанием. Многие исследовательские лаборатории мира использовали эти наработки для своих решений, включаяSberDevices, разработавший русскоязычный аналог под названием ruGPT-3 в пяти вариациях, от 125 млн до 13 млрд параметров, используя мощности суперкомпьютера «Кристофари».
В 2019 году OpenAI, становясь крайне перспективной, реорганизуется из некоммерческой в коммерческую и становится партнером Microsoft. В 2020 году выходит GPT-3 — нейронная сеть, наделавшая шума как самая сложная, объемная и многообещающая модель по работе с текстовыми данными. Количество параметров в ней увеличивается более чем в 100 раз и достигает 175 млрд признаков. Учитывая теперь уже коммерческую основу OpenAI, модель GPT-3 становится проектом проприетарного типа, т. е. с закрытым программным кодом, доступ к которому выдается за деньги, а в статье, описывающей GPT-3, приводятся только некоторые технические параметры и множество результатов тестирования.
Последним творением OpenAI стала GPT-4, ультимативно крупная модель, способная обрабатывать на входе и изображения, и текст. Конечно, в статье о ней разработчики не стали раскрывать никаких сколь-либо важных деталей, ограничиваясь демонстрацией блестящих результатов модели и огромными усилиям по безопасности их использования. «Учитывая как конкурентную среду, так и последствия для безопасности крупномасштабных моделей, таких как GPT-4, этот отчет не содержит дополнительных подробностей об архитектуре (включая размер модели), оборудовании, обучающих вычислениях, построении набора данных, метода обучения или прочего», — объясняется в материале (полный листинг статей об исследованиях опубликован на сайте самой компании).
Впрочем, если поспрашивать чат-бота Bing, он расскажет, что GPT-4 обучена с использованием 100 трлн параметров, что примерно в 600 раз больше, чем у его предшественника GPT-3.5. Официально эти цифры нигде не звучали, так что нельзя исключать галлюцинацию нейросети.
Что же будет с GPT-5? Гендиректор OpenAI Альтман в середине апреля говорил, что компания не занимается обучением этой модели, совершенствуя GPT-4. А выступая на мероприятии Массачусетского технологического института, он сообщил, что быстрое развитие нейронных сетей теперь должно существенно замедлиться: «Мы находимся в конце эпохи, когда будут использоваться настолько гигантские языковые модели. Далее мы будем улучшать их уже другими способами».
Дошли ли разработчики до определенного технологического предела или, наоборот, подходят к точке сингулярности — тема для отдельного разговора.
Айрат Нурутдинов
Мнение авторов блогов не обязательно отражает точку зрения редакции