Система работает на основе нейронных сетей.
Недавно стало известно, что компания Facebook разработала новый механизм преобразование написанного текста в речь, на базе серверов CPU и при помощи нейронных сетей. Представители компании официально заявили о том, что система обладает огромной вычислительной мощностью, а сгенерированную речь сложно отличить от человеческой.
Интересно, что предыдущие подобные технологии брали за основу графические процессоры или другое, тому подобное, специальное оборудование. В нынешней же технологии используются процессоры CPU, при помощи последних скорость синтезирования речи увеличилась более чем в 150 раз. Представители разработчиков заявили о том, что новая технология поможет в будущем улучшить качество некоторых мобильных и компьютерных приложений, а также программного обеспечения искусственного интеллекта. Обновленное качество генерирования речи станет более приятным в использовании для обыденных юзеров.
Каким образом генерируется речь из текста
Специально разработанный интерфейс преобразует лингвистический кластер текста в аналогичные функции, последние складываются из фонем и типичных предложений. Далее механизм генерирует модель просодии, корректирует мелодию и ритм для более выразительного воссоздания. Далее специальный механизм придает спектральности дорожке звука. В итоге звуковой сигнал выдается в качестве 24 кГц.
Недавно стало известно, что компания Facebook приобрела сервис Giphy для интеграции его API в продукты социальной сети, а также платформы Instagram и других приложений. Кроме того, недавно в сети появились новости о том, что Google Chrome начнет бороться с «тяжелой» рекламой. Об удалении баннера будет сообщаться соответствующим окном, на месте его размещения.
Оригинал статьи на нашем сайте: https://h-it.ru/preobrazovanie-teksta-v-rech-novaya-tekhnologiya-ot-facebook