Искусственный интеллект быстро меняет требования к инфраструктуре. Если ещё недавно основной темой были обучение моделей и мощные GPU-кластеры, то сейчас ситуация меняется. На первый план выходит инференс — работа уже обученных моделей в реальном времени. И именно это начинает перестраивать всю архитектуру ИИ-систем. Сегодня около 75–85 % AI-нагрузок связано не с обучением, а с инференсом. ИИ всё чаще используется как практический инструмент: При этом такие нагрузки больше не ограничиваются одним дата-центром. Они распределяются между: То есть ИИ начинает работать ближе к месту появления данных — там, где важны минимальные задержки и мгновенная реакция. По мере роста распределённого ИИ компании сталкиваются с новой сложностью. Проблема теперь не только в мощности GPU. Становится всё труднее управлять: Когда все элементы существуют отдельно, инфраструктура начинает тормозить развитие вместо того, чтобы ускорять его. Именно поэтому Cisco делает ставку на архитектурный подход. Cisco совме
ИИ выходит из дата-центров. Cisco и NVIDIA готовят для этого новую инфраструктуру
15 мая15 мая
5
3 мин