Найти тему
Все об IT

Как NVIDIA надеется индустриализировать ИИ с помощью MLOps

Оглавление

Мы все еще тратим слишком много времени на обучение машинным моделям, а не на их развертывание. Может ли MLOps - который объединяет специалистов по данным и DevOps - стать решением?

Абстрактная футуристика с двух сторон между цифровой связью нейронной сети и роботизированным лицом искусственного интеллекта.

Мы определённо вышли за рамки научного проекта, в течение многих лет развертывания искусственного интеллекта (ИИ), и у нас есть работа, которую нужно сделать, прежде чем мы преодолеем "хрупкую" фазу. Некоторые ритейлеры, такие как Walmart, использовали машинное обучение (ML) для улучшения прогнозирования при одновременном снижении стоимости товарно-материальных запасов. Но многие другие тратят много времени на построение моделей, которые так и не были развернуты, сказал в интервью Тони Пэйкей (Tony Paikeday), директор по маркетингу продуктов в портфеле NVIDIA DGX суперкомпьютеров для искусственного интеллекта и платформы NVIDIA для ускоренного сбора данных.

Что нам нужно, сказал он, так это "индустриализация ИИ", отчасти путем объединения специалистов по данным с DevOps. Похоже, что NVIDIA полностью вовлечена в этот новый подход, называемый "MLOps", и компания может быть в чем-то заинтересована.

Не просто коробка

Но сначала, признание, которое я предложу на случай, если вы совершите ту же ошибку. Я всегда думал о NVIDIA как о компании по производству чипов - знаете, о той компании, которая создала графический чип еще в те времена, когда это делало видеоигры крутыми. С тех пор NVIDIA и другие компании расширили использование этих графических процессоров (GPU) в таких областях, как высокопроизводительные вычисления и искусственный интеллект.

Но все же, аппаратное обеспечение, не так ли?

По словам Пайкедея, в прошлом клиенты покупали GPU, вставляли его в сервер и применяли к нему открытые исходные коды (например, TensorFlow). Это работало (вроде того), но ломалось по мере того, как увеличивался размер наборов данных. Распараллелить такие нагрузки между процессорами становилось все сложнее. Стало очевидно, что таким клиентам необходимо кластерное программное обеспечение.

Более того, NVIDIA решила, что ей нужен полный стек, оптимизированный с уровня драйверов, чтобы компания могла распараллелить не только несколько GPU, но и несколько систем. NVIDIA просто не могла позволить себе откладывать обучение - компания нуждалась в своих моделях быстро.

Учитывая все это в контексте, Nvidia годами занималась разработкой программного обеспечения. Действительно, сейчас NVIDIA тратит больше времени на разработку программного обеспечения со своими клиентами, чем на самостоятельную работу с аппаратным обеспечением.

НЕ просто куча коробок

Это подводит нас к другой части бизнеса NVIDIA, связанной с ИИ: Где потребитель работает с аппаратным/программным обеспечением NVIDIA? Короткий ответ - "где бы они ни захотели", так как NVIDIA в некоторой степени агностична в отношении того, где работают ее решения. Потребитель, однако, не является таковым.

По мнению Paikeday, большинство клиентов начинают работать в публичном облаке, и то, останутся ли они там, зависит от нескольких факторов. Используя поговорку "Поезд, где находятся ваши данные", сказал Пайкедай, клиенты, которые создают данные в облаке, будут склонны запускать свои модели обучения ИИ там. Клиенты также могут проводить обучение в компьютерном облаке, чтобы иметь возможность выполнять итерации и быстро обучаться. Учитывая, насколько новым ИИ останется для стольких людей, облако - это отличное место для изучения.

Но по мере того, как размер набора данных или моделей клиента растет, и у них появляются более сложные прототипы, "начинает ощущаться влияние гравитации данных", сказал он, что делает экономически эффективным отказ от платы за транзит данных за счет локального хранения данных. По его словам, некоторые из них могут чувствовать, что могут получить лучшие результаты от инфраструктуры с фиксированной стоимостью, а также централизации операций в "центре искусственного интеллекта", где они могут объединять опыт разных команд, воспитывать новых талантливых специалистов и многое другое.

Не коробка вообще

Везде, где предприятия предпочитают использовать свои модели обучения, компаниям необходимо быстро разобраться в том, как ввести в действие свою систему сбора и обработки данных. Одна из проблем заключается в том, что специалисты по работе с данными, как правило, не являются подготовленными инженерами и не всегда следуют надлежащей практике DevOps. Хуже того, исследователи данных, инженеры и ИТ-специалисты часто работают изолированно. Все это способствует тому, что ИИ становится хрупким и незрелым внутри предприятия.

Святой Грааль, по крайней мере для некоторых, является MLOps, объединяющим ИИ и Операции, подобно тому, что было сделано между Разработкой и Операциями (DevOps). Цели? Как сформулировал Кайл Галлатин (Kyle Gallatin), инженер по ML в компании Pfizer:

  • Сократить время и трудности, связанные с запуском моделей в производство.
  • Уменьшить трения между командами и усилить сотрудничество.
  • Улучшить отслеживание, версионирование, мониторинг и управление моделями.
  • Создайте по-настоящему циклический жизненный цикл для современной модели ML
  • Стандартизировать процесс машинного обучения, чтобы подготовиться к возрастающему регулированию и политике.

Звучит прямолинейно, да? Ну, конечно, нет, иначе у нас не было бы хрупкого ИИ, который мы делаем сегодня. NVIDIA, - сказал Пэйкедей, - создает платформу, которая позволяет специалистам по работе с данными тесно сотрудничать с людьми из DevOps и таким образом уменьшить трения между этими спарринг-группами.

Это хорошая цель. Это также не то, что вы ожидаете от компании по производству чипов, которые помогают заставить графику видеоигр петь. Но на самом деле это уже не то, чем занимается NVIDIA. По крайней мере, не полностью. Сегодня она еще больше сосредоточена на создании программного обеспечения, которое будет служить соединительной тканью для специалистов по данным и DevOps внутри предприятия, чтобы ИИ перешел из кустарного производства в промышленное.