В научно-исследовательском отделе разработки прикладного и системного программного обеспечения МТУСИ создали сервис KSA — Keyword spotting application, который поможет автоматически находить и извлекать ключевые слова из аудиозаписей.
Keyword spotting (распознавание ключевых слов) в аудиоаналитике — это технология, которая позволяет автоматически находить и извлекать ключевые слова из аудиоматериалов. Разработка может применяться в различных областях: безопасность, медицина, производство и реклама.
Keyword spotting может помочь в обеспечении безопасности на производстве путем автоматического мониторинга аудиопотоков на предмет ключевых слов, связанных с опасными ситуациями или небезопасными действиями. При обнаружении таких ключевых слов система автоматически отправляет предупреждения на мониторы безопасности или к другим ответственным лицам на производстве.
Это позволяет оперативно реагировать на возможные угрозы и принимать меры для предотвращения возможных несчастных случаев. Кроме того, система может использоваться для голосового управления техникой и решения широкого спектра технических задач.
В системе используются такие методы машинного обучения, как транслируемые сверточные сети последнего поколения BC-Resnet. Эти модели сегодня являются одними из лидеров в показателях точности в задаче KWS (Keyword spotting) в бенчмарке Google Speech Command. Модель, используемая в данном сервисе, обучена на специально собранном DataSet и имеет точность 91,86 процентов по метрике ROC-AUC.
Развитие системы немаловажно, поскольку она улучшает эффективность и точности анализа данных. Это помогает сократить время и ресурсы, затрачиваемые на ручной анализ, и повысить качество получаемых результатов. Более точные и эффективные системы могут существенно повысить безопасность и качество жизни людей в различных областях.