Я не стану яро доказывать, что российские технологии искусственного интеллекта являются безусловными лидерами, превосходящими все мировые аналоги, и что в ближайшее время наши разработки кардинально изменят географию планеты.
Конечно, на текущем этапе развития российский ИИ уступает не только американским, но и китайским достижениям. Но это отставание обусловлено не отсутствием талантов или интеллектуального потенциала, а совокупностью вполне объективных и объяснимых обстоятельств.
Сравнение с сельскохозяйственной спецификой разных регионов здесь очень даже уместно: никто не станет ожидать от Чукотки банановых плантаций, конкурирующих с эквадорскими, также, как и от Эквадора какого-то масштабного оленеводства. Это просто вопрос природно-экономических условий, а не чьей-то несостоятельности.
Дорогие читатели, чтобы видеть еще больше полезных и интересных статей, подписывайтесь на наш канал. Для вас это 5 секунд, а для нас стимул развиваться. Спасибо.
Поэтому смею предположить, что нынешнее положение дел с развитием ИИ в нашей стране не должно вызывать чувства неловкости или ущемленного самолюбия. Нужно понимать предпосылки сложившейся ситуации. Они коренятся в объективных макроэкономических и технологических процессах.
Для адекватного восприятия этой картины нужно разобраться в природе самого явления, которое мы называем искусственным интеллектом.
Термин «интеллект» здесь, грубо говоря, не совсем корректен. Современные нейросети представляют собой виртуозные системы обработки и воспроизведения информации, накопленной человечеством. Они анализируют гигантские массивы данных, доступных в сети, и на основе статистических закономерностей формируют релевантный контексту ответ.
Давайте вообразим себе интернет, состоящий из единственного тематического ресурса - форума автомобилистов, посвященного неисправностям.
На форуме возникает вопрос:
- Автомобиль не запускается, какие могут быть причины?
Сообщество предлагает три варианта ответа, два из которых основаны на практическом опыте, а один содержит долю иронии:
- Возможно, закончилось топливо?
- Вероятно, разрядился аккумулятор?
- Протри фары, и проблема решится!
Эти три ответа и составляют весь объем доступной информации по данному вопросу в нашей гипотетической сети.
Теперь представим, что на основе этого ограниченного контента создается нейросеть. При обращении к ней с тем же самым вопросом о причинах отказа двигателя она, конечно, предложит именно эти три варианта, так как они исчерпывают доступный ей информационный фонд.
Современные нейросети, которые принято называть «ИИ», не обладают пониманием физических принципов работы двигателя внутреннего сгорания. У них нет представления о том, что такое автомобиль как техническая система и какие неисправности в принципе могут возникать в процессе эксплуатации. Единственная доступная им функция - статистический анализ предшествующего человеческого опыта и генерация ответов на основе выявленных закономерностей.
В условиях нашего выдуманного интернета, состоящего из одного автомобильного форума с тремя ответами, нейросеть, проанализировав доступный корпус текстов, выдаст следующий результат:
- Рекомендуется проверить наличие топлива в баке.
- Рекомендуется проверить уровень заряда аккумулятора.
- Рекомендуется протереть фары.
Третий пункт не вызовет у системы никакого внутреннего диссонанса, потому что она не способна установить причинно-следственные связи между чистотой оптики и запуском силового агрегата. Механизм ее работы сводится к воспроизведению информации, обнаруженной в исходных материалах.
Отсюда следует важное ограничение: если на форуме автолюбителей отсутствует упоминание о необходимости проверки свечей зажигания, наша нейросеть никогда самостоятельно не придет к такому выводу, сколь бы очевидным он ни казался человеку, знакомому с устройством автомобиля.
Человек, разбирающийся в технике, способен к логическому мышлению и дедукции. Ему не требуется обращаться к интернету за каждым ответом, поскольку он понимает внутренние взаимосвязи элементов системы. Искусственный же интеллект лишен этого понимания, он оперирует исключительно предоставленными данными и не способен к самостоятельному умозаключению за пределами известного.
Ему недоступно знание о существовании свечей зажигания как потенциальной причины проблем с пуском. Неизвестно, что в моторном отсеке могут поселиться грызуны, повреждающие электропроводку (подобный случай, кстати говоря, реально был). Если эта информация будет зафиксирована в каком-либо источнике и попадет в обучающую выборку, то система сможет ее учесть.
Так, качество работы нейросети напрямую зависит от объема и полноты предоставленных ей данных для обучения. Для создания действительно эффективной системы необходим не один тематический ресурс с тремя ответами, а миллионы разнообразных источников с тысячами вариантов решений различных задач.
Проанализировав миллионы ответов, нейросеть сможет выделить десять-пятнадцать наиболее статистически достоверных причин отказа двигателя. При этом маловероятно, что в финальный перечень попадут какие-то шуточные варианты. Система способна отслеживать корреляцию между содержанием ответа и реакцией аудитории. Ответы, получающие негативные или иронические оценки, будут идентифицированы как ошибочные и отсеяны.
Так что эффективность искусственного интеллекта определяется прежде всего качеством и объемом исходных данных, на которых производится обучение. Чем обширнее информационная база и чем разнообразнее предоставленные материалы, тем более глубокими и точными будут ответы нейросети.Теперь давайте попробуем сопоставить объем и качество исходных материалов, доступных для обучения искусственного интеллекта в России, с теми ресурсами, которыми располагают разработчики в Соединенных Штатах.
Масштаб интернет-пространства.
Начнем с наиболее фундаментального фактора. Доминирующим языком глобальной сети является английский. Русскоязычный сегмент интернета уступает англоязычному по объему как минимум на порядок.
Английский язык используется не только тремястами тридцатью миллионами граждан США. Это язык общения жителей Великобритании, Австралии, Канады, Новой Зеландии, значительной части Европы и множества других регионов планеты.
Нейросеть, обучающаяся на англоязычном контенте, изначально получает доступ к информационной базе, многократно превосходящей ту, что доступна при обучении на русском языке.
Кстати, китайский интернет, обслуживающий полтора миллиарда пользователей, обладает значительно большим объемом по сравнению с российским сегментом.
Источники данных за пределами открытого интернета.
Обучающие выборки для современных нейросетей формируются не только из общедоступных веб-страниц и текстов.
Подавляющее большинство компьютеров и мобильных устройств, которыми мы пользуемся работают под управлением операционных систем американского производства: Windows, macOS, Android, iOS и других.
Эти системы (и да, это не какая-то теория заговора, а задокументированная функция), собирают телеметрию о действиях пользователя. Понятное дело, существует возможность отказаться от передачи данных, сняв соответствующие галочки в настройках, но большинство пользователей этого не делает.
А значит американские разработчики ИИ имеют возможность дополнительно обучать свои модели на обезличенных данных о поведении миллиардов людей, полученных непосредственно с уровня операционных систем.
Аналогичная ситуация с платформами по типу YouTube. Сервисом пользуется практически все население планеты, и каждый пользователь невольно вносит вклад в обучение американского ИИ: алгоритмы анализируют, какие видео вызывают интерес, какие получают положительные оценки, какие поисковые запросы вводят зрители, как долго удерживается внимание на том или ином контенте.Добавим к этому поисковую систему Google. Ее ежедневная аудитория на порядок превышает количество пользователей Яндекса.
Накапливаются колоссальные объемы информации, исчисляемые миллиардами гигабайт, которые становятся доступными для обучения американских нейросетей. Российские разработчики, увы, не имеют доступа к этим массивам данных.
Содержимое личных коммуникаций.
Совокупная аудитория таких платформ, как WhatsApp, Facebook и Instagram, достигает приблизительно трех с половиной миллиардов человек.
Напомню, что все перечисленные сервисы находятся под управлением одной американской корпорации: Meta.
У меня нет как таковых документальных подтверждений, но вполне могу предположить:
Абсолютно не исключено, что Meta задействовала триллионы личных сообщений, накопленных за годы существования WhatsApp, Instagram и Facebook, в качестве обучающего материала для своих моделей искусственного интеллекта.
С формально-юридической точки зрения здесь тяжело поймать нарушение конфиденциальности: искусственный интеллект не является человеком, это технология. Предоставление ей доступа к личной переписке вполне реализуемо. Достаточно включить соответствующий пункт в пользовательское соглашение, которое, конечно же, практически никто не читает.
Теперь давайте попробуем оценить, какой объем полезной информации для обучения ИИ может содержаться в этой переписке. Это уже не три ответа с нашего условного автомобильного форума. Здесь представлены все мыслимые аспекты человеческой жизни, рассмотренные под самыми разными углами, во всем многообразии жизненных ситуаций и сценариев.
Обработав эти триллионы сообщений, нейросеть неизбежно становится значительно более совершенной и начинает гораздо глубже понимать человеческое поведение, мотивы и контекст коммуникации.
Даже если пользователь WhatsApp общается на русском, казахском, тайском или японском языке - эта переписка все равно поступает в обучающую выборку американского искусственного интеллекта, а не российского, тайского или казахского.
Так какие же объемы данных доступны для анализа российским нейросетям? Даже если рассматривать перспективу полного охвата аудитории такого сервиса, как, допустим, VK, мы говорим максимум о ста миллионах пользователей. Сопоставьте сами: сто миллионов против трех с половиной миллиардов. Разница в тридцать пять раз.
Поэтому западные системы искусственного интеллекта исходно обладают информационной базой для обучения, которая может быть в сотни раз обширнее российской. Причина этого весьма простая: ведущие западные IT-корпорации имеют глобальный охват. Их продукты интегрированы в компьютеры и смартфоны по всему миру, что позволяет собирать данные о поведении миллиардов пользователей.
Российский же ИИ, в силу географической и технологической ограниченности, вынужден опираться преимущественно на поведенческие паттерны десятков, в лучшем случае: сотен миллионов человек. Разница в объемах доступных данных составляет порядок, а то и несколько порядков.
Это фундаментальная причина текущего положения дел, и изменить ее, честно говоря, крайне сложно.
Дорогие читатели, чтобы видеть еще больше полезных и интересных статей, подписывайтесь на наш канал. Для вас это 5 секунд, а для нас стимул развиваться. Спасибо.
Но существует и второй фактор, также носящий объективный характер, но в большей степени поддающийся влиянию.
Суть в объеме инвестиций.
Создание и развитие искусственного интеллекта это, в первую очередь, колоссальные финансовые вливания.
Для понимания всего масштаба: только корпорация Microsoft (разработчик Windows) инвестировала в развитие своего ИИ около пятнадцати миллиардов долларов. Для сравнения: эта сумма сопоставима с валовым внутренним продуктом некоторых небольших государств, таких как Киргизия или Молдавия.
На что вообще расходуются столь значительные средства? Значительная их часть уходит на создание вычислительной инфраструктуры. Представьте, какой мощностью должны обладать серверы, способные обработать триллионы гигабайт информации в процессе обучения, а потом в режиме реального времени обслуживать запросы миллиардов пользователей по всей планете.
Энергопотребление таких вычислительных комплексов настолько велико, что для их бесперебойной работы требуется мощность, сопоставимая с выработкой целой атомной электростанции.И вот тогда еще вопрос: какое количество инженеров, разработчиков, технических специалистов и обслуживающего персонала нужно для поддержания работы такой инфраструктуры?
Это требует реально больших финансовых вложений.
Но корпорации уровня Microsoft спокойно могут позволить себе подобные инвестиции, поскольку они экономически обоснованы и с высокой вероятностью окупятся. В чем суть механизма окупаемости: Microsoft является глобальной корпорацией, а ее операционная система Windows установлена на 67 процентах всех компьютеров в мире.
Совершенствуя свои продукты с помощью технологий искусственного интеллекта, компания получает возможность увеличить объем продаж на сотни миллиардов долларов. В этом контексте тринадцать миллиардов инвестиций выглядят, как вполне рациональное вложение.
Допустим, что такую же сумму в развитие своего ИИ попытается вложить Яндекс. Тогда за счет каких источников эти инвестиции могут быть возвращены?
К тому же, если совокупная рыночная капитализация Яндекса составляет около пяти миллиардов долларов, то где изыскать средства в размере почти трехкратной стоимости всей компании?
Хорошо, гипотетически, такие ресурсы есть у Сбера (это сопоставимо буквально с половиной его годовой прибыли). Но даже если Сбер направит эту половину годовой прибыли на развитие своего ИИ-продукта (GigaChat), вопрос о дальнейшей окупаемости этих вложений по-прежнему остается открытым.
Ключевое различие заключается в масштабах рынка. Microsoft оперирует на глобальном рынке, охватывающем всю планету. Сбер работает преимущественно на российском рынке (с некоторым присутствием в отдельных зарубежных странах). И вновь мы наблюдаем существенную разницу.
Это сопоставимо с ситуацией, когда крупная федеральная торговая сеть и небольшой местный магазин находятся в заведомо разных весовых категориях. Конечно, сетевой ритейлер может позволить себе несопоставимо большие инвестиции, чем овощной ларек, благодаря колоссальной разнице в охвате рынка и объемах продаж.
Поэтому текущее отставание российского искусственного интеллекта это не чья-то ошибка или недостаток компетенций, а объективно обусловленный процесс, предопределенный предшествующим ходом глобального технологического и экономического развития.
Для того чтобы отечественные разработки в области ИИ могли выдерживать полноценную конкуренцию с западными аналогами, потребовалось бы переместиться во времени на три-четыре десятилетия назад, в период становления современной IT-индустрии. И вместо тех событий, которые привели к разрушению сложившейся системы и хаосу девяностых, нужно было бы параллельно выстраивать корпорации масштаба Microsoft, Intel, Apple.
В идеальном сценарии сегодняшнего дня на половине компьютеров мира была бы установлена американская Windows, но не менее 20-30% занимала бы российская операционная система по типу «Звездочка». Половина мирового рынка поисковых систем принадлежала бы Google, а 20-30% Яндексу.
Такое же соотношение следовало бы иметь в сегменте мессенджеров, видеохостингов, прикладного программного обеспечения и прочих цифровых продуктов.
При условии, что российский искусственный интеллект имеет меньший объем данных для обучения и не получает столь обильного финансирования, как в Соединенных Штатах, сами по себе отечественные модели демонстрируют более высокую эффективность в расчете на имеющиеся ресурсы.
Алгоритмы обучаются качественнее американских, но ограничены информационной базой, а недостаточный уровень инвестиций не позволяет задействовать суперкомпьютеры, сопоставимые с западными, для глобального масштабирования технологий.
В отдельных направлениях российские системы даже превосходят американские. В качестве примера приводилось компьютерное зрение.
Наиболее показательная реализация этой технологии: возможность оплачивать покупки улыбкой, разработанная Сбером. Внешне это может восприниматься как развлекательная функция, но за ней стоит чрезвычайно сложный технологический комплекс, который на Западе так и не удалось внедрить в полноценно работающее решение.
Дорогие читатели, чтобы видеть еще больше полезных и интересных статей, подписывайтесь на наш канал. Для вас это 5 секунд, а для нас стимул развиваться. Спасибо.
Существуют и другие подобные разработки, хотя их не так много, как хотелось бы.
Так, в условиях существующих ограничений (невысокого уровня инвестиций и сравнительно небольшой базы для обучения) российским разработчикам приходится извлекать полный максимум возможного из того ограниченного набора ресурсов, который имеется в их распоряжении.
Если однажды произойдёт прорыв, и в российские ИИ начнут активно инвестировать, а объёмы данных для обучения заметно вырастут, то отечественные системы искусственного интеллекта смогут не только догнать американские аналоги, но и с огромным успехом превзойти их.