Ученые из НИУ ВШЭ разработали алгоритм, который позволяет точно и быстро измерять частоту основного тона речи даже при высоком уровне фонового шума Как сообщает ТАСС со ссылкой на пресс-службу НИУ ВШЭ, новый алгоритм поможет нейросетям лучше распознавать эмоции и речь человека. Частота основного тона речи является важным параметром для распознавания эмоций и диагностики заболеваний, а предложенный подход работает даже в условиях шума и без задержки во времени. При этом алгоритм задействует меньше вычислительных ресурсов, чем известные аналоги, подчеркивают разработчики. Он построен на базе доработанных классических математических методов, в том числе преобразования Фурье, которые применяются при обработке звука компьютерными программами. Классические подходы значительно теряют в точности работы, если сигнал записан при высоком уровне фонового шума или с помощью некачественного микрофона. Ученые выяснили, что обрабатываемый сигнал можно очистить от помех при помощи созданной ими простой
Алгоритм научили точно определять высоту голоса. Это поможет нейросетям распознавать эмоции
3 ноября 20233 ноя 2023
9
1 мин