Один из руководителей компании Alibaba заявил о создании нейросети, предназначенной для идентификации человека по голосу. Она эффективна в шумных местах с большим количеством людей и демонстрирует точность распознавания в пределах 95 %.
Особенности реализации
Искусственный интеллект обрабатывает естественный язык в режиме онлайн, используя для этого облачный сервис. Применяются как программные, так и аппаратные составляющие. Алгоритм нейросети взаимодействует с системой направленно-удалённых микрофонов, что позволяет отрезать лишние голоса.
Компания Alibaba уже давно использует технологии искусственного интеллекта и машинного обучения в своей работе. В частности, именно ИИ отвечает за приём сотен звонков от клиентов сервиса Alime. Нейросеть участвует в общении и с людьми в чате, вырезая фрагменты текста и подбирая нужные изображения с учётом запроса. Эксперты Alibaba утверждают, что ИИ делает эти операции быстрее обычных сотрудников.
Искусственного интеллекта становится всё больше
Месяцем ранее разработчикам Google также удалось запустить проект для идентификации личности человека по голосу в толпе. Он назывался VoiceFilter, причём для его реализации потребовалась одновременная работа сразу двух нейросетей — для распознавания говорящего и для сравнения звуковых спектрограмм, имеющихся в базе данных.
На практике подобные проекты уже работают в метро Шанхая, позволяя выполнять оплату проезда по голосу.
Загляни за горизонт событий вместе с OTUS! Приходи на курс «Machine Learning»:
УСПЕТЬ НА КУРС