Найти в Дзене
Интерфакс-Россия

Новосибирские ученые усовершенствовали алгоритм распознавания речи

Новосибирск. 18 апреля. ИНТЕРФАКС - Специалисты Новосибирского госуниверситета ввели новый модуль в открытую систему "Писец", сообщил "Интерфаксу" разработчик системы, научный сотрудник лаборатории прикладных цифровых технологий Механико-математического факультета НГУ Иван Бондаренко. "Мы ввели туда модерацию неопределенности - система помечает слово, в котором она не уверена", - сказал ученый на полях международной конференции по искусственному интеллекту и естественному языку "AINL-2025". Для пользователя сомнительное слово будет выделяться серым цветом, отметил он. По словам Бондаренко, "Писец" реализуется как достаточно компактная языковая модель с перспективой установки на различные девайсы. Также на базе китайской Qwen Audio в лаборатории планируется сделать большую мультимодальную модель для русского языка, чтобы она могла одновременно воспринимать русский текст, русскую речь неречевые акустические события, определять количество говорящих и т.д. Бондаренко отметил, что в текущем

Новосибирск. 18 апреля. ИНТЕРФАКС - Специалисты Новосибирского госуниверситета ввели новый модуль в открытую систему "Писец", сообщил "Интерфаксу" разработчик системы, научный сотрудник лаборатории прикладных цифровых технологий Механико-математического факультета НГУ Иван Бондаренко.

"Мы ввели туда модерацию неопределенности - система помечает слово, в котором она не уверена", - сказал ученый на полях международной конференции по искусственному интеллекту и естественному языку "AINL-2025".

Для пользователя сомнительное слово будет выделяться серым цветом, отметил он.

По словам Бондаренко, "Писец" реализуется как достаточно компактная языковая модель с перспективой установки на различные девайсы.

Также на базе китайской Qwen Audio в лаборатории планируется сделать большую мультимодальную модель для русского языка, чтобы она могла одновременно воспринимать русский текст, русскую речь неречевые акустические события, определять количество говорящих и т.д.

Бондаренко отметил, что в текущем году "Писец" не писал "Тотальный диктант".

Как сообщалось, годом ранее система продемонстрировала хорошие знания грамматики, но допустила ошибки в словах, которые услышала неверно.

Изначально "Писец" разрабатывался год назад для автоматического стенографирования звукозаписей интервью или защит диссертаций. Соответственно, даже 20-30% ошибок в расшифрованных текстах - это уже тот уровень, который позволяет человеку гораздо быстрее подготовить чистовой текст стенограммы, чем если бы он писал его "с нуля".

Понравилась статья? Обязательно напишите ваше мнение в комментариях. Больше интересных материалов — на канале Интерфакс-Россия в Дзене. Подписывайтесь!

Читайте также на Interfax-Russia.Ru: