Добавить в корзинуПозвонить
Найти в Дзене
Умен и богат

МГУ построил новый суперкомпьютер почти за 3 млрд. руб. Его задача — развитие технологий ИИ. За них в университете отвечает дочь Путина.

Часть 1 На предыдущих суперкомпьютерах МГУ («Чебышев», «Ломоносов» и «Ломоносов-2») заявку на вычисления мог оставить любой коллектив из любого вуза или НИИ России. «Я не помню, чтобы кому-то с адекватным запросом отказывали. Более того — самыми интересными работами других организаций отчитывались перед чиновниками, самыми передовыми исследованиями гордились и собирали в годовой отчет. Момент престижа очень важен: МГУ показывал, что хорошая наука делается на «Ломоносове». А сами научные группы должны были в своих отчетах (например, грантовых) сообщать, что результаты были получены с помощью «Ломоносова» и присылать в НИВЦ отчеты на полстранички о результатах. Особенно региональным ученым помогали с доступом инфраструктурные гранты РНФ. С «МГУ-270» это работает не так: на нем, как я понимаю, считают только МГУшники», — рассказывает T-invariant бывший сотрудник университета с опытом расчетов на суперкомпьютерах МГУ. С ним согласен и руководитель одной из крупнейших компаний отрасли: «Маш
Оглавление

Расследование

Часть 2.

Часть 1

Работать на «МГУ-270» смогут только сотрудники МГУ (и то, вероятно, не все). «Чужакам» машина будет доступна в исключительных случаях

На предыдущих суперкомпьютерах МГУ («Чебышев», «Ломоносов» и «Ломоносов-2») заявку на вычисления мог оставить любой коллектив из любого вуза или НИИ России.

«Я не помню, чтобы кому-то с адекватным запросом отказывали. Более того — самыми интересными работами других организаций отчитывались перед чиновниками, самыми передовыми исследованиями гордились и собирали в годовой отчет. Момент престижа очень важен: МГУ показывал, что хорошая наука делается на «Ломоносове». А сами научные группы должны были в своих отчетах (например, грантовых) сообщать, что результаты были получены с помощью «Ломоносова» и присылать в НИВЦ отчеты на полстранички о результатах. Особенно региональным ученым помогали с доступом инфраструктурные гранты РНФ. С «МГУ-270» это работает не так: на нем, как я понимаю, считают только МГУшники», — рассказывает T-invariant бывший сотрудник университета с опытом расчетов на суперкомпьютерах МГУ.

С ним согласен и руководитель одной из крупнейших компаний отрасли: «Машину контролируют специальные люди, которые теперь гораздо бóльшую роль играют в любом университете, — люди в погонах. Насколько я знаю, доступ ограничен даже внутри МГУ, работать дают только отдельным группам и людям, политически зрелым и проверенным».

«Процедура получения доступа всегда была очень прозрачна, — рассказывает один из сотрудников МГУ. — В публичном доступе есть документы и список организаций, которые работали на суперкомпьютерах «Ломоносов». Раньше для получения доступа писали письмо на имя ректора МГУ с просьбой предоставить доступ конкретным сотрудникам.

Сейчас же правила изменились, и формулировка звучит так: «Руководителем и ответственным исполнителем планируемых работ должны являться штатные сотрудники Московского университета. В рамках последующего исполнения работ возможно сотрудничество коллективов МГУ с другими организациями». Оригинал сообщения сохранился в архиве, также есть пример с сайта химфака МГУ. Желающим дают опросный лист, в котором значится следующее:

На суперкомпьютере «270 лет МГУ» будут выполняться вычислительные эксперименты по решению задач, связанных с технологиями искусственного интеллекта (ИИ). Архитектура суперкомпьютера «270 лет МГУ» основана на использовании высокопроизводительных графических ускорителей. Суперкомпьютер планируется использовать для решения задач, требующих больших вычислительных ресурсов (связанных с анализом больших объемов данных). Для получения доступа к суперкомпьютеру необходимо пройти первичный отбор проектов.

«На вычисления всегда были долгие очереди в МГУ, и внутри университета было очень много желающих. Возможно, сейчас «МГУ-270» используется для задач по ИИ, а они [задачи] жутко прожорливые и требуют много ресурсов», — рассказывает один из бывших сотрудников НИВЦ МГУ.

Новый суперкомпьютер, видимо, будет также использоваться руководством МГУ в качестве щедрого жеста в адрес избранных коллег и институций. Например, в конце ноября 2023 года соглашение о сотрудничестве подписали МГУ и Объединенный институт ядерных исследований (Дубна). В пресс-релизе Садовничий, помимо прочего, говорит, что «готов задействовать потенциал Научно-исследовательского вычислительного центра МГУ, в том числе новейший, введенный в строй 1 сентября этого года суперкомпьютер «МГУ-270» с уникальными вычислительными характеристиками». Это единственное найденное публичное заявление МГУ о предоставлении доступа к новому супервычислителю кому-либо вне университета.

У ОИЯИ есть свой суперкомпьютер под названием «Говорун», но он, по словам опрошенных в Дубне ученых, «устарел и постоянно ломается», а для полноценной работы нового коллайдера NICA понадобятся немалые вычислительные мощности.

А что стало с «Ломоносов-2»?

Если обратить внимание на фотографии «МГУ-270», можно заметить поразительное сходство новой машины со старыми «Ломоносовыми», обращают внимание собеседники T-invariant. Отчасти это объясняется в пресс-релизе университета: «Компьютер с новой архитектурой, основанной на активном использовании графических процессоров, составит единый вычислительный кластер с суперкомпьютером «Ломоносов-2»». Один из участников вычислений в МГУ комментирует это так: «Важно заявлять, что строилось новое, а не модернизировалось старое: и чисто по маркетинговыми причинам, и гораздо приятнее отчитываться и интервью потом давать».
«Черные ящики на фото не Nvidia, а обычные Supermicro (но внутри все равно карточки Nvidia и процессоры AMD. Это своего рода «клон», дженерик оригинального DGX от Nvidia. Выглядит так, что они просто убрали все панели «T-Платформ» (компания, которая собирала «Ломоносовых», — T-invariant), а шкафы остались еще от давно разобранного «Ломоносов-1», их снова использовали», — рассказал бывший сотрудник МГУ, ранее работавший на «Ломоносове-2».

Эффективность «МГУ-270» очень трудно оценить со стороны, а открытый рейтинг суперкомпьютеров не обновляется с начала войны

Опрошенные T-invariant эксперты неохотно берутся оценивать уровень нового суперкомпьютера МГУ, потому что университет не предоставил данные в мировой Топ-500, а российский рейтинг, который много лет вел НИВЦ МГУ, перестал обновляться после 2022 года. Эта причина, естественно, не названа напрямую, но на сайте значится следующее объявление:

В сложившихся условиях сформировавшаяся практика списков Топ-50 объективно отразить изменения как в области применения высокопроизводительных вычислительных систем, так и касательно передовых суперкомпьютерных технологий не способна и может способствовать некорректной трактовке статистики, что противоречит целям проекта. В связи с этим мы приняли решение временно приостановить публикацию новых редакций рейтинга. Мы признательны всем тем, кто на протяжении многих лет делал свой вклад в развитие данного проекта и пополнял его, и искренне надеемся, что в обозримом будущем сможем анонсировать возобновление публикации списков.

Рейтинг перестал обновляться, потому что после 24 февраля 2022 года все комплектующие (как для «МГУ-270», так и для апгрейда остальных российских машин — трех у «Яндекса», двух у Сбера и одной у МТС) поставляются с помощью серого или черного импорта, считают несколько опрошенных участников рынка.

Добавьте описание
Добавьте описание

Технологии ИИ в МГУ курирует Катерина Тихонова. Среди ее задач не только создание «нашего ChatGPT», но и развитие БПЛА

В последнем послании Федеральному собранию в начале 2024 года Владимир Путин заявил, что Россия «должна достичь технологического суверенитета в областях генеративного искусственного интеллекта и больших языковых моделей». Он отметил, что утверждена новая государственная стратегия развития ИИ: «Мощность отечественных суперкомпьютеров до 2030 года должна быть увеличена в 10 раз».

Тема суперкомпьютеров (как и все цифровое) включена в нацпроект «Экономика данных», на который власти РФ запланировали потратить 700 миллиардов рублей до 2030 года (конец нынешнего срока Путина).

Ведущий центр искусственного интеллекта должен быть создан в МГУ — об этом еще в мае 2019 года гендиректор Российского фонда прямых инвестиций (РФПИ) Кирилл Дмитриев заявил на совещании с участием Путина. Тот идею поддержал и назвал ​​важнейшим элементом при выработке национальной стратегии ИИ. В итоге в 2020 году в МГУ был создан Институт искусственного интеллекта, который, по информации ряда СМИ, возглавила Катерина Тихонова — дочь Путина и генеральный директор фонда «Национальное интеллектуальное развитие» (работает под брендом «Иннопрактика», учредитель — МГУ). Связь двух организаций описана в новостях сайта фонда. Помимо этого «Иннопрактика» реализует масштабный многомиллиардный инвестиционный проект по созданию в Москве научно-технологической долины МГУ.

Информации об участии Тихоновой в жизни МГУ на официальных страницах университета мало (есть упоминания на страницах «Иннопрактики» и страница на портале научной активности МГУ «Истина»). Среди прочего, Тихонова фигурирует и как член Ученого совета МГУ (архив, 2015 год).

У Института ИИ много интересных исследований и публикаций (вот годовой отчет за 2023 год), в том числе работа над языковыми моделями, аналогичными популярным чат-ботам. Обсуждается задача создать отечественный ответ ChatGPT, и этим сейчас занимаются в университетах, подтвердили несколько собеседников T-invariant.

В апреле 2023 года сотрудники МГУ и Сколтеха, выступая на конференции Data Fusion, говорили, что предполагаемая дата появления «российского ChatGPT» — 2025 год. Руководитель лаборатории семантического обучения ИИ (в составе Института ИИ МГУ) Константин Воронцов тогда предлагал назвать его «Наш GPT», а директор Центра технологий ИИ Иван Оселедец рассуждал, что «обучение ИИ языкам и культурам народов страны требует значительных инвестиций и ресурсов, включая этнографические экспедиции, филологов и философов».

«До февраля 2022 года у института Тихоновой были свои вычислительные мощности, и они считали многое на своей базе. У Тихоновой и так целый свой корпус в МГУ, и насколько под них строился «МГУ-270», трудно сказать. Но в деньгах и ресурсах она не нуждается, «Иннопрактику» поддерживает практически весь крупный бизнес России», — говорит один из бывших сотрудников НИВЦ МГУ, уже не работающий в университете.

Большие языковые модели и конкуренция с компаниями типа OpenAI или Google в других областях — это красиво и эффектно, но, по мнению самой Тихоновой, в стране «более прагматичный подход в развитии ИИ», «обусловленный задачами и вызовами, стоящими перед Россией», — это «применение в БПЛА и в нефтегазовой отрасли». Об этом она рассказала на конференции Data Fusion-2024. Пятиминутное видео выступления Тихоновой названо «Многополярность технологического мира будущего: роль России».

«У российского искусственного интеллекта есть своя национальная специфика, есть свои исследования по большим языковым моделям и генеративному ИИ, но Россия отстает в темпе развития от общемирового и пока мы скорее следуем за трендами, чем создаем их», — считает Тихонова. Не страшны, по ее мнению, и международные санкции для университетов и институтов: «Россия не была полностью исключена из мирового контекста, ученые продолжают публиковаться в топовых мировых журналах и выступать на топовых мировых конференциях. У нас есть всё: люди, кадры».

Кроме многополярности, Тихонову очень волнует суверенитет. Так, открытие Института ИИ МГУ «при экспертной поддержке» «Иннопрактики» было «согласовано со стратегией безопасности РФ». Об этом дочь Путина рассказывала крупнейшим бизнесменам и чиновникам на последнем форуме «Иннопрактики», тематикой которого стал «Совокупный суверенитет».

Чем занимается Институт ИИ МГУ и при чем тут технологии двойного назначения?

Полное название центра Тихоновой — «Институт перспективных исследований проблем искусственного интеллекта и интеллектуальных систем МГУ имени М. В. Ломоносова». Если судить по отчету за 2023 год, центр производит вполне живое впечатление. Работы публикуются в нормальных журналах (в том числе журналах группы Nature). Темы, которыми занимаются сотрудники Института, актуальны для современной научной повестки. Среди ученых, работающих с Институтом ИИ, необходимо отметить известного специалиста — нейробиолога Михаила Лебедева. По информации на сайте, в Институте ИИ работают четыре лаборатории:

  • Машинное обучение и семантический анализ;
  • Интеллектуальный анализ видео;
  • Искусственный интеллект в биоинформатике и медицине;
  • Разработка инвазивных нейроинтерфейсов.

Есть еще четыре научные группы, которые, вероятно, имеют перспективу стать полноценными лабораториями.

Первые две лаборатории — это чистая «цифра», третья и четвертая — это, в том числе, «мокрая» биология и нейробиология. Ученые много выступают и на научных конференциях (в основном в Китае), и перед широкой публикой, публикуют статьи, в том числе и научно-популярные.

Большинство работ во всех четырех лабораториях, которые отражены в отчете за 2023 год, — это, так сказать, наука двойного назначения. Практически про любой проект можно рассказать, как он работает на войну, хотя и в гражданских целях полученные результаты тоже можно использовать.

Самый известный проект лаборатории «Машинное обучение и семантический анализ» — нейросеть поиска релевантной научной информации SciRus-tiny. Академик Алексей Хохлов так охарактеризовал эту работу в своем телеграм-канале: »…нейросеть SciRus-tiny теперь применена в варианте, когда пользователь может загружать в поисковое поле произвольный текст любой длины. Нейросеть тогда определит те статьи из базы данных eLIBRARY, которые ближе всего по тематике к введенному тексту». Правда, следует отметить, что eLIBRARY не самая полная и не самая авторитетная научная библиотека.

Меньше известно о другом проекте лаборатории, получившем название «Новостной коллайдер». Разработчики пишут в отчете, в частности, следующее:

Инструмент обработки больших текстовых массивов «Новостной коллайдер». В ходе проекта разрабатываются технологии семантической разметки текстов, используемых в социогуманитарных исследованиях. Основные операции включают выделение текстовых фрагментов, их классификацию, связывание и комментирование при необходимости. Такие методы позволяют анализировать большие объемы данных (СМИ, соцсети, архивы) для исследований, например, воздействия на общественное мнение и выявления потенциально опасных дискурсов.

Какие дискурсы сегодня считаются российскими властями «опасными», хорошо известно. Как и то, что для «прочесывания» соцсетей и публикаций СМИ можно использовать нейросетевые инструменты. Так что вероятное применение «новостного коллайдера» вполне можно себе представить. Скорее всего, это и будет поиск «опасного дискурса».

Не менее важным делом занимается лаборатория «Интеллектуальный анализ видео». Судя по отчету, важное направление работы лаборатории — нейросетевые методы сжатия видео и восстановления высокой четкости. Эти методы могут использоваться, например, при передаче видео по узким каналам, в том числе — по спутниковым. Во время войны спутниковая съемка для военной разведки очень важна.

Лаборатория «Искусственный интеллект в биоинформатике и медицине» занимается мультиомикой, то есть самыми разными направлениями геномики, протеомики (исследования белков) и т. д. Здесь суперкомпьютер просто необходим, чтобы использовать такие передовые методы, как предсказание структуры белков по аминокислотной последовательности. Это делает, например, нейросеть AlphaFold компании Google DeepMind, но есть и другие подобные решения. Главные направления работы лаборатории — это фармакология и диагностика на основе машинного обучения.

Лаборатория «Разработка инвазивных нейроинтерфейсов» занимается созданием нейропротезов и разными методами нейрореабилитации. Здесь работают над лечением нейропатических и фантомных болей, которые часто сопутствуют травмам и ампутациям. Война — это эпидемия травматизма.

Необходимо отметить, что пока этот центр сравнительно небольшой. В мире существуют сотни куда более мощных исследовательских центров, занятых исследованием ИИ, мультиомики и нейроинтерфейсов (в основном в США и Китае). Когда Илон Маск решил создать свой суперкомпьютер, он его построил меньше чем за год. И его детище, насколько можно судить по открытой информации, примерно на порядок мощнее, чем «МГУ-270». Вычислительные возможности — даже с учетом запуска суперкомпьютера — у Института ИИ довольно скромные. Охват тем — довольно ограниченный, даже по сравнению с отделениями Сбера, занятыми ИИ, или с «Яндексом». Но это вполне современный центр.

Как использовать суперкомпьютер, ученые Института ИИ, судя по всему, понимают. Простаивать он не будет. Скорее всего, большинство приложений будет иметь военное или двойное назначение и о многих из них открытой информации мы в ближайшие годы не получим

Еще по теме экономики и технологии:

«Они нашли лазейку». После повышения утильсбора растут поставки в Россию автомобилей из Китая по доверенностям от покупателей
«Все под покровом тайны, тихо, чтобы никто ничего не заподозрил» В VK — массовые сокращения, уволены сотни сотрудников
«ВКонтакте» отключил возможность поиска видео «для взрослых»
«Интернет рано или поздно сломают». Власти решили потратить на изоляцию рунета почти 10 млрд рублей

Пожалуйста, подпишитесь на новый канал "Жизнь Дурова: ЗОЖ, деньги, ИТ" - все самое главное о здоровье, технологиях и деньгах