Привет, на связи опять Артём — техлид mClouds ⛅️ Продолжаю цикл публикаций перед вебинаром — «GPU в облаке: как выжать максимум без лишних затрат». В прошлый раз я показывал, что можно получить до 60 FPS через RDP на наших оптимизированных шаблонах операционных систем — актуально для работы с графикой: CAD, 3D, визуализация, чтобы обеспечить плавность картинки. Сейчас подсвечу, как можно использовать в AI/ML GPU и почему не все GPU одинаковы. 🔹 Кейс 1. Попытаться распознать запись разговора (аудио в текст), чтобы затем выполнить анализ текста. Решение казалось бы очевидным — по API подключиться к SpeechKit и получать запись разговора. Нюанс: SpeechKit показывал результат ошибок на реальных записях 45%. Как сократить? Использовать другие сервисы. Пробовали, но процент ошибок был на уровне 29%. Я был бы не инженером, если бы не провёл тестирование со своими записями и не сравнил WER (word error rate). Как сравнить? Зашёл на наш сайт mClouds.ru, прочитал текст на сайте и сделал запись. С
Тестируем SpeechKit, Whisper и видеокарты
29 июля 202529 июл 2025
3
1 мин