Найти в Дзене
Цифровой Океан

Алгоритм научили точно определять высоту голоса. Это поможет нейросетям распознавать эмоции

Ученые из НИУ ВШЭ разработали алгоритм, который позволяет точно и быстро измерять частоту основного тона речи даже при высоком уровне фонового шума

Как сообщает ТАСС со ссылкой на пресс-службу НИУ ВШЭ, новый алгоритм поможет нейросетям лучше распознавать эмоции и речь человека. Частота основного тона речи является важным параметром для распознавания эмоций и диагностики заболеваний, а предложенный подход работает даже в условиях шума и без задержки во времени.

При этом алгоритм задействует меньше вычислительных ресурсов, чем известные аналоги, подчеркивают разработчики. Он построен на базе доработанных классических математических методов, в том числе преобразования Фурье, которые применяются при обработке звука компьютерными программами. Классические подходы значительно теряют в точности работы, если сигнал записан при высоком уровне фонового шума или с помощью некачественного микрофона.

-2

Ученые выяснили, что обрабатываемый сигнал можно очистить от помех при помощи созданной ими простой однослойной нейросети, способной отделять звуки речи от белого шума. Алгоритм может применяться во множестве областей — при разработке голосовых помощников, способных распознавать речь и эмоции владельца, а также в области психологии и медицины.

Здесь мы рассказываем, как работают нейросети:

Freepik