Найти в Дзене
МК в Новосибирске

Новосибирские учёные разработали сервис для быстрого озвучивания научных книг

Специалисты Новосибирского государственного университета запустили пилотный сервис, который с помощью нейросети превращает научные тексты из PDF-файлов в аудиокниги. Технология работает в десятки раз быстрее традиционной записи диктором. Учёные Новосибирского государственного университета представили пилотный проект по автоматическому созданию аудиоверсий научной литературы. Система использует нейросети для преобразования текста из PDF-файлов в аудиоформат и позволяет выполнять озвучивание примерно в 16 раз быстрее, чем при записи диктором, пишет ТАСС. Разработка создана на базе собственного фреймворка «Каппа», который используют специалисты Центра искусственного интеллекта НГУ. Сервис уже применили для озвучивания первых 100 научных книг. В дальнейшем разработчики планируют перевести в аудиоформат до 7 тысяч изданий из электронной библиотеки университета. Работы будут проводиться с согласия правообладателей. По оценкам создателей проекта, на обработку одной книги требуется около 30 ми

Специалисты Новосибирского государственного университета запустили пилотный сервис, который с помощью нейросети превращает научные тексты из PDF-файлов в аудиокниги. Технология работает в десятки раз быстрее традиционной записи диктором.

    Фото: Сиб.фм
Фото: Сиб.фм

Учёные Новосибирского государственного университета представили пилотный проект по автоматическому созданию аудиоверсий научной литературы. Система использует нейросети для преобразования текста из PDF-файлов в аудиоформат и позволяет выполнять озвучивание примерно в 16 раз быстрее, чем при записи диктором, пишет ТАСС.

Разработка создана на базе собственного фреймворка «Каппа», который используют специалисты Центра искусственного интеллекта НГУ. Сервис уже применили для озвучивания первых 100 научных книг.

В дальнейшем разработчики планируют перевести в аудиоформат до 7 тысяч изданий из электронной библиотеки университета. Работы будут проводиться с согласия правообладателей.

По оценкам создателей проекта, на обработку одной книги требуется около 30 минут процессорного времени. При полной загрузке системы озвучивание всего фонда может занять примерно месяц, однако дополнительное время — до года — потребуется на проверку и согласование материалов.