Добавить в корзинуПозвонить
Найти в Дзене
Игнатий Цукергохер

Cloud.ru запустил Evolution Stack.ML для обучения моделей в частном и гибридном облаке

Cloud.ru запустил в коммерческую эксплуатацию платформу Evolution Stack.ML для распределённого обучения ИИ-моделей и разработки ИИ-приложений в частном и гибридном облаке. Решение позволяет использовать собственные вычислительные ресурсы с возможностью масштабирования в публичное облако. Оно также обеспечивает контроль над данными с учётом требований регуляторов, рассказали блогу «Игнатий Цукергохер» в пресс-службе Cloud.ru. В основе платформы — сервис Evolution Distributed Train, предназначенный для обучения и тюнинга моделей, их развертывания и совместной работы команд. Платформа объединяет инструменты разработки, управления экспериментами и мониторинга. В Evolution Stack.ML поддерживается запуск изолированных рабочих пространств для более чем 200 команд одновременно. Механизмы очередей, приоритетов, аллокаций и спотов распределяют нагрузку между задачами и повышают эффективность использования GPU-инфраструктуры. Утилизация GPU может увеличиваться с 35% до 90%, срок окупаемости серве

Cloud.ru запустил в коммерческую эксплуатацию платформу Evolution Stack.ML для распределённого обучения ИИ-моделей и разработки ИИ-приложений в частном и гибридном облаке. Решение позволяет использовать собственные вычислительные ресурсы с возможностью масштабирования в публичное облако. Оно также обеспечивает контроль над данными с учётом требований регуляторов, рассказали блогу «Игнатий Цукергохер» в пресс-службе Cloud.ru.

В основе платформы — сервис Evolution Distributed Train, предназначенный для обучения и тюнинга моделей, их развертывания и совместной работы команд. Платформа объединяет инструменты разработки, управления экспериментами и мониторинга.

В Evolution Stack.ML поддерживается запуск изолированных рабочих пространств для более чем 200 команд одновременно. Механизмы очередей, приоритетов, аллокаций и спотов распределяют нагрузку между задачами и повышают эффективность использования GPU-инфраструктуры. Утилизация GPU может увеличиваться с 35% до 90%, срок окупаемости серверных мощностей — менее трёх месяцев. Совместное использование кластеров ускоряет обучение и разработку ИИ-решений на 20%.

Механизмы self-healing автоматически выявляют сбои, перезапускают задачи и заменяют GPU-ноды, обеспечивая стабильную работу распределённых задач. OSS-слой платформы позволяет отслеживать загрузку инфраструктуры и контролировать расходы.

Решение ориентировано на организации с повышенными требованиями к безопасности, включая государственный и финансовый сектор, операторов ЦОД и промышленность. Платформа соответствует требованиям по обработке и хранению персональных и финансовых данных, а также размещению ГИС и КИИ.

«Evolution Stack.ML помогает преодолеть барьеры для внедрения ИИ в крупном бизнесе и государственных компаниях — решение соответствует строгим требованиям к безопасности и нормам регуляторов. Evolution Stack.ML повышает экономическую эффективность использования собственного “железа” и при этом дает доступ к самым современным технологиям и методам работы с ИИ», — сказал Михаил Лобоцкий, генеральный директор Cloud.ru.

💬 MAX | 💬 TG | 💙 VK |🔗Сайт | 📝 Дзен
🎁
Розыгрыш неттопа iRU