Расследование
Часть 2.
Часть 1
Работать на «МГУ-270» смогут только сотрудники МГУ (и то, вероятно, не все). «Чужакам» машина будет доступна в исключительных случаях
На предыдущих суперкомпьютерах МГУ («Чебышев», «Ломоносов» и «Ломоносов-2») заявку на вычисления мог оставить любой коллектив из любого вуза или НИИ России.
«Я не помню, чтобы кому-то с адекватным запросом отказывали. Более того — самыми интересными работами других организаций отчитывались перед чиновниками, самыми передовыми исследованиями гордились и собирали в годовой отчет. Момент престижа очень важен: МГУ показывал, что хорошая наука делается на «Ломоносове». А сами научные группы должны были в своих отчетах (например, грантовых) сообщать, что результаты были получены с помощью «Ломоносова» и присылать в НИВЦ отчеты на полстранички о результатах. Особенно региональным ученым помогали с доступом инфраструктурные гранты РНФ. С «МГУ-270» это работает не так: на нем, как я понимаю, считают только МГУшники», — рассказывает T-invariant бывший сотрудник университета с опытом расчетов на суперкомпьютерах МГУ.
С ним согласен и руководитель одной из крупнейших компаний отрасли: «Машину контролируют специальные люди, которые теперь гораздо бóльшую роль играют в любом университете, — люди в погонах. Насколько я знаю, доступ ограничен даже внутри МГУ, работать дают только отдельным группам и людям, политически зрелым и проверенным».
«Процедура получения доступа всегда была очень прозрачна, — рассказывает один из сотрудников МГУ. — В публичном доступе есть документы и список организаций, которые работали на суперкомпьютерах «Ломоносов». Раньше для получения доступа писали письмо на имя ректора МГУ с просьбой предоставить доступ конкретным сотрудникам.
Сейчас же правила изменились, и формулировка звучит так: «Руководителем и ответственным исполнителем планируемых работ должны являться штатные сотрудники Московского университета. В рамках последующего исполнения работ возможно сотрудничество коллективов МГУ с другими организациями». Оригинал сообщения сохранился в архиве, также есть пример с сайта химфака МГУ. Желающим дают опросный лист, в котором значится следующее:
На суперкомпьютере «270 лет МГУ» будут выполняться вычислительные эксперименты по решению задач, связанных с технологиями искусственного интеллекта (ИИ). Архитектура суперкомпьютера «270 лет МГУ» основана на использовании высокопроизводительных графических ускорителей. Суперкомпьютер планируется использовать для решения задач, требующих больших вычислительных ресурсов (связанных с анализом больших объемов данных). Для получения доступа к суперкомпьютеру необходимо пройти первичный отбор проектов.
«На вычисления всегда были долгие очереди в МГУ, и внутри университета было очень много желающих. Возможно, сейчас «МГУ-270» используется для задач по ИИ, а они [задачи] жутко прожорливые и требуют много ресурсов», — рассказывает один из бывших сотрудников НИВЦ МГУ.
Новый суперкомпьютер, видимо, будет также использоваться руководством МГУ в качестве щедрого жеста в адрес избранных коллег и институций. Например, в конце ноября 2023 года соглашение о сотрудничестве подписали МГУ и Объединенный институт ядерных исследований (Дубна). В пресс-релизе Садовничий, помимо прочего, говорит, что «готов задействовать потенциал Научно-исследовательского вычислительного центра МГУ, в том числе новейший, введенный в строй 1 сентября этого года суперкомпьютер «МГУ-270» с уникальными вычислительными характеристиками». Это единственное найденное публичное заявление МГУ о предоставлении доступа к новому супервычислителю кому-либо вне университета.
У ОИЯИ есть свой суперкомпьютер под названием «Говорун», но он, по словам опрошенных в Дубне ученых, «устарел и постоянно ломается», а для полноценной работы нового коллайдера NICA понадобятся немалые вычислительные мощности.
А что стало с «Ломоносов-2»?
Если обратить внимание на фотографии «МГУ-270», можно заметить поразительное сходство новой машины со старыми «Ломоносовыми», обращают внимание собеседники T-invariant. Отчасти это объясняется в пресс-релизе университета: «Компьютер с новой архитектурой, основанной на активном использовании графических процессоров, составит единый вычислительный кластер с суперкомпьютером «Ломоносов-2»». Один из участников вычислений в МГУ комментирует это так: «Важно заявлять, что строилось новое, а не модернизировалось старое: и чисто по маркетинговыми причинам, и гораздо приятнее отчитываться и интервью потом давать».
«Черные ящики на фото не Nvidia, а обычные Supermicro (но внутри все равно карточки Nvidia и процессоры AMD. Это своего рода «клон», дженерик оригинального DGX от Nvidia. Выглядит так, что они просто убрали все панели «T-Платформ» (компания, которая собирала «Ломоносовых», — T-invariant), а шкафы остались еще от давно разобранного «Ломоносов-1», их снова использовали», — рассказал бывший сотрудник МГУ, ранее работавший на «Ломоносове-2».
Эффективность «МГУ-270» очень трудно оценить со стороны, а открытый рейтинг суперкомпьютеров не обновляется с начала войны
Опрошенные T-invariant эксперты неохотно берутся оценивать уровень нового суперкомпьютера МГУ, потому что университет не предоставил данные в мировой Топ-500, а российский рейтинг, который много лет вел НИВЦ МГУ, перестал обновляться после 2022 года. Эта причина, естественно, не названа напрямую, но на сайте значится следующее объявление:
В сложившихся условиях сформировавшаяся практика списков Топ-50 объективно отразить изменения как в области применения высокопроизводительных вычислительных систем, так и касательно передовых суперкомпьютерных технологий не способна и может способствовать некорректной трактовке статистики, что противоречит целям проекта. В связи с этим мы приняли решение временно приостановить публикацию новых редакций рейтинга. Мы признательны всем тем, кто на протяжении многих лет делал свой вклад в развитие данного проекта и пополнял его, и искренне надеемся, что в обозримом будущем сможем анонсировать возобновление публикации списков.
Рейтинг перестал обновляться, потому что после 24 февраля 2022 года все комплектующие (как для «МГУ-270», так и для апгрейда остальных российских машин — трех у «Яндекса», двух у Сбера и одной у МТС) поставляются с помощью серого или черного импорта, считают несколько опрошенных участников рынка.
Технологии ИИ в МГУ курирует Катерина Тихонова. Среди ее задач не только создание «нашего ChatGPT», но и развитие БПЛА
В последнем послании Федеральному собранию в начале 2024 года Владимир Путин заявил, что Россия «должна достичь технологического суверенитета в областях генеративного искусственного интеллекта и больших языковых моделей». Он отметил, что утверждена новая государственная стратегия развития ИИ: «Мощность отечественных суперкомпьютеров до 2030 года должна быть увеличена в 10 раз».
Тема суперкомпьютеров (как и все цифровое) включена в нацпроект «Экономика данных», на который власти РФ запланировали потратить 700 миллиардов рублей до 2030 года (конец нынешнего срока Путина).
Ведущий центр искусственного интеллекта должен быть создан в МГУ — об этом еще в мае 2019 года гендиректор Российского фонда прямых инвестиций (РФПИ) Кирилл Дмитриев заявил на совещании с участием Путина. Тот идею поддержал и назвал важнейшим элементом при выработке национальной стратегии ИИ. В итоге в 2020 году в МГУ был создан Институт искусственного интеллекта, который, по информации ряда СМИ, возглавила Катерина Тихонова — дочь Путина и генеральный директор фонда «Национальное интеллектуальное развитие» (работает под брендом «Иннопрактика», учредитель — МГУ). Связь двух организаций описана в новостях сайта фонда. Помимо этого «Иннопрактика» реализует масштабный многомиллиардный инвестиционный проект по созданию в Москве научно-технологической долины МГУ.
Информации об участии Тихоновой в жизни МГУ на официальных страницах университета мало (есть упоминания на страницах «Иннопрактики» и страница на портале научной активности МГУ «Истина»). Среди прочего, Тихонова фигурирует и как член Ученого совета МГУ (архив, 2015 год).
У Института ИИ много интересных исследований и публикаций (вот годовой отчет за 2023 год), в том числе работа над языковыми моделями, аналогичными популярным чат-ботам. Обсуждается задача создать отечественный ответ ChatGPT, и этим сейчас занимаются в университетах, подтвердили несколько собеседников T-invariant.
В апреле 2023 года сотрудники МГУ и Сколтеха, выступая на конференции Data Fusion, говорили, что предполагаемая дата появления «российского ChatGPT» — 2025 год. Руководитель лаборатории семантического обучения ИИ (в составе Института ИИ МГУ) Константин Воронцов тогда предлагал назвать его «Наш GPT», а директор Центра технологий ИИ Иван Оселедец рассуждал, что «обучение ИИ языкам и культурам народов страны требует значительных инвестиций и ресурсов, включая этнографические экспедиции, филологов и философов».
«До февраля 2022 года у института Тихоновой были свои вычислительные мощности, и они считали многое на своей базе. У Тихоновой и так целый свой корпус в МГУ, и насколько под них строился «МГУ-270», трудно сказать. Но в деньгах и ресурсах она не нуждается, «Иннопрактику» поддерживает практически весь крупный бизнес России», — говорит один из бывших сотрудников НИВЦ МГУ, уже не работающий в университете.
Большие языковые модели и конкуренция с компаниями типа OpenAI или Google в других областях — это красиво и эффектно, но, по мнению самой Тихоновой, в стране «более прагматичный подход в развитии ИИ», «обусловленный задачами и вызовами, стоящими перед Россией», — это «применение в БПЛА и в нефтегазовой отрасли». Об этом она рассказала на конференции Data Fusion-2024. Пятиминутное видео выступления Тихоновой названо «Многополярность технологического мира будущего: роль России».
«У российского искусственного интеллекта есть своя национальная специфика, есть свои исследования по большим языковым моделям и генеративному ИИ, но Россия отстает в темпе развития от общемирового и пока мы скорее следуем за трендами, чем создаем их», — считает Тихонова. Не страшны, по ее мнению, и международные санкции для университетов и институтов: «Россия не была полностью исключена из мирового контекста, ученые продолжают публиковаться в топовых мировых журналах и выступать на топовых мировых конференциях. У нас есть всё: люди, кадры».
Кроме многополярности, Тихонову очень волнует суверенитет. Так, открытие Института ИИ МГУ «при экспертной поддержке» «Иннопрактики» было «согласовано со стратегией безопасности РФ». Об этом дочь Путина рассказывала крупнейшим бизнесменам и чиновникам на последнем форуме «Иннопрактики», тематикой которого стал «Совокупный суверенитет».
Чем занимается Институт ИИ МГУ и при чем тут технологии двойного назначения?
Полное название центра Тихоновой — «Институт перспективных исследований проблем искусственного интеллекта и интеллектуальных систем МГУ имени М. В. Ломоносова». Если судить по отчету за 2023 год, центр производит вполне живое впечатление. Работы публикуются в нормальных журналах (в том числе журналах группы Nature). Темы, которыми занимаются сотрудники Института, актуальны для современной научной повестки. Среди ученых, работающих с Институтом ИИ, необходимо отметить известного специалиста — нейробиолога Михаила Лебедева. По информации на сайте, в Институте ИИ работают четыре лаборатории:
- Машинное обучение и семантический анализ;
- Интеллектуальный анализ видео;
- Искусственный интеллект в биоинформатике и медицине;
- Разработка инвазивных нейроинтерфейсов.
Есть еще четыре научные группы, которые, вероятно, имеют перспективу стать полноценными лабораториями.
Первые две лаборатории — это чистая «цифра», третья и четвертая — это, в том числе, «мокрая» биология и нейробиология. Ученые много выступают и на научных конференциях (в основном в Китае), и перед широкой публикой, публикуют статьи, в том числе и научно-популярные.
Большинство работ во всех четырех лабораториях, которые отражены в отчете за 2023 год, — это, так сказать, наука двойного назначения. Практически про любой проект можно рассказать, как он работает на войну, хотя и в гражданских целях полученные результаты тоже можно использовать.
Самый известный проект лаборатории «Машинное обучение и семантический анализ» — нейросеть поиска релевантной научной информации SciRus-tiny. Академик Алексей Хохлов так охарактеризовал эту работу в своем телеграм-канале: »…нейросеть SciRus-tiny теперь применена в варианте, когда пользователь может загружать в поисковое поле произвольный текст любой длины. Нейросеть тогда определит те статьи из базы данных eLIBRARY, которые ближе всего по тематике к введенному тексту». Правда, следует отметить, что eLIBRARY не самая полная и не самая авторитетная научная библиотека.
Меньше известно о другом проекте лаборатории, получившем название «Новостной коллайдер». Разработчики пишут в отчете, в частности, следующее:
Инструмент обработки больших текстовых массивов «Новостной коллайдер». В ходе проекта разрабатываются технологии семантической разметки текстов, используемых в социогуманитарных исследованиях. Основные операции включают выделение текстовых фрагментов, их классификацию, связывание и комментирование при необходимости. Такие методы позволяют анализировать большие объемы данных (СМИ, соцсети, архивы) для исследований, например, воздействия на общественное мнение и выявления потенциально опасных дискурсов.
Какие дискурсы сегодня считаются российскими властями «опасными», хорошо известно. Как и то, что для «прочесывания» соцсетей и публикаций СМИ можно использовать нейросетевые инструменты. Так что вероятное применение «новостного коллайдера» вполне можно себе представить. Скорее всего, это и будет поиск «опасного дискурса».
Не менее важным делом занимается лаборатория «Интеллектуальный анализ видео». Судя по отчету, важное направление работы лаборатории — нейросетевые методы сжатия видео и восстановления высокой четкости. Эти методы могут использоваться, например, при передаче видео по узким каналам, в том числе — по спутниковым. Во время войны спутниковая съемка для военной разведки очень важна.
Лаборатория «Искусственный интеллект в биоинформатике и медицине» занимается мультиомикой, то есть самыми разными направлениями геномики, протеомики (исследования белков) и т. д. Здесь суперкомпьютер просто необходим, чтобы использовать такие передовые методы, как предсказание структуры белков по аминокислотной последовательности. Это делает, например, нейросеть AlphaFold компании Google DeepMind, но есть и другие подобные решения. Главные направления работы лаборатории — это фармакология и диагностика на основе машинного обучения.
Лаборатория «Разработка инвазивных нейроинтерфейсов» занимается созданием нейропротезов и разными методами нейрореабилитации. Здесь работают над лечением нейропатических и фантомных болей, которые часто сопутствуют травмам и ампутациям. Война — это эпидемия травматизма.
Необходимо отметить, что пока этот центр сравнительно небольшой. В мире существуют сотни куда более мощных исследовательских центров, занятых исследованием ИИ, мультиомики и нейроинтерфейсов (в основном в США и Китае). Когда Илон Маск решил создать свой суперкомпьютер, он его построил меньше чем за год. И его детище, насколько можно судить по открытой информации, примерно на порядок мощнее, чем «МГУ-270». Вычислительные возможности — даже с учетом запуска суперкомпьютера — у Института ИИ довольно скромные. Охват тем — довольно ограниченный, даже по сравнению с отделениями Сбера, занятыми ИИ, или с «Яндексом». Но это вполне современный центр.
Как использовать суперкомпьютер, ученые Института ИИ, судя по всему, понимают. Простаивать он не будет. Скорее всего, большинство приложений будет иметь военное или двойное назначение и о многих из них открытой информации мы в ближайшие годы не получим
Еще по теме экономики и технологии:
«Они нашли лазейку». После повышения утильсбора растут поставки в Россию автомобилей из Китая по доверенностям от покупателей
«Все под покровом тайны, тихо, чтобы никто ничего не заподозрил» В VK — массовые сокращения, уволены сотни сотрудников
«ВКонтакте» отключил возможность поиска видео «для взрослых»
«Интернет рано или поздно сломают». Власти решили потратить на изоляцию рунета почти 10 млрд рублей