Microsoft объявила о расширении сотрудничества с Meta*, выбравшей сервис Azure в качестве стратегического поставщика облачных услуг, что позволит ускорить ведение разработок в области ИИ. Любопытно, что Meta* второй раз при создании крупных систем обращается к сторонним подрядчикам, а не строит их сама — ранее компания анонсировала ИИ-суперкомпьютер RSC на базе узлов NVIDIA DGX A100.
Для исследований в это сфере Meta* будет применять выделенный кластер Microsoft Azure с новейшими инстансами NDm A100 v4 на базе 5400 единиц ускорителей NVIDIA A100 и 1350 процессоров AMD Milan Epyc 7V13. Впервые Meta* начала использовать Microsoft Azure для исследований в сфере ИИ в прошлом году, но в гораздо меньших масштабах.
Microsoft утверждает, что благодаря в четыре раза большей пропускной способности сети между виртуальными машинами по сравнению с другими публичными облачными решениями платформа Azure обеспечивает более быстрое распределенное обучение ИИ. Meta* использовала это преимущество, например, для обучения языковой модели OPT-175B.
Инстансы Azure NDm A100 v4 также предоставляют клиентам возможность гибкой автоматической и динамической настройки кластеров любого размера от нескольких GPU до тысяч единиц, а также возможность приостанавливать и возобновлять работу во время экспериментов.
Microsoft и Meta* также будут сотрудничать в разработке платформы машинного обучения PyTorch для Python, библиотеки с открытым исходным кодом, над которой работает лаборатория искусственного интеллекта Facebook*. Параллельно Meta* также заключила партнёрское соглашение с Amazon Web Services (AWS) с целью разработки PyTorch и решений в сфере ИИ.
* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».