Математическую модель распознавания речи, превосходящую аналоги по отдельным параметрам в несколько раз, создали ученые ТУСУРа. По их словам, разработка может стать основой комплексной системы цифровой идентификации личности, а также позволит легче управлять «умной» техникой с помощью голоса. Об этом сообщил Проектный офис «Приоритет 2030» ТУСУР.
Определение личности по голосу с помощью распознавания речи – активно развивающийся подход к цифровой безопасности, применяемый при управлении техникой и в системах безопасности банковских сервисов дистанционного обслуживания, сообщили специалисты.
Ученые Томского государственного университета систем управления и радиоэлектроники (ТУСУР) разработали новую математическую модель распознавания речи, превосходящую аналоги по точности и позволяющую корректно идентифицировать говорящего.
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль», – рассказал заместитель директора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР Антон Конев.
По словам ученых, погрешность при распознавании основного тона речи у новой системы в четыре раза меньше, чем у лучших мировых аналогов. Это позволяет разработке намного лучше справляться с распознаванием обычной спонтанной речи или даже пения.
Как объяснили создатели, эта возможность поможет, например, общаться с «умными» системами не с помощью формальных команд, а почти так же, как с обычным живым собеседником.
«Наша разработка особенно эффективна при распознавании различных аббревиатур, редко встречающихся слов и фраз. Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении «умной» техникой», – подчеркнул Конев.
Одним из результатов работы, как объяснили ученые ТУСУРа, должна стать система продленной аутентификации, которая позволит в течение всего сеанса связи удостоверять личность собеседника. Это позволит полностью исключить некоторые типы мошенничества, уверены ученые.
Кроме инструментов повышения цифровой безопасности, связанных с речью, специалисты ТУСУРа также создают нейросетевые инструменты, ориентированные на работу с текстом. По словам ученых, их подход позволит проверять авторство различных текстовых материалов, от сообщений в социальных сетях до исходного кода программного обеспечения.
В дальнейшем научный коллектив намерен разработать комплексное программное решение, которое позволит контролировать присутствие конкретного абонента в чате, веб-конференции или переписке в электронной почте, а также отличать бота от реального человека.
Работа по данному направлению ведется в рамках государственной программы Минобрнауки «Приоритет-2030».
Источник: РИА Новости