Cloud.ru запустил в коммерческую эксплуатацию платформу Evolution Stack.ML для распределённого обучения ИИ-моделей и разработки ИИ-приложений в частном и гибридном облаке. Решение позволяет использовать собственные вычислительные ресурсы с возможностью масштабирования в публичное облако. Оно также обеспечивает контроль над данными с учётом требований регуляторов, рассказали блогу «Игнатий Цукергохер» в пресс-службе Cloud.ru. В основе платформы — сервис Evolution Distributed Train, предназначенный для обучения и тюнинга моделей, их развертывания и совместной работы команд. Платформа объединяет инструменты разработки, управления экспериментами и мониторинга. В Evolution Stack.ML поддерживается запуск изолированных рабочих пространств для более чем 200 команд одновременно. Механизмы очередей, приоритетов, аллокаций и спотов распределяют нагрузку между задачами и повышают эффективность использования GPU-инфраструктуры. Утилизация GPU может увеличиваться с 35% до 90%, срок окупаемости серве
Cloud.ru запустил Evolution Stack.ML для обучения моделей в частном и гибридном облаке
ВчераВчера
2
1 мин