Совсем скоро немые люди получат возможность для свободного и внятного произношения слов. А помогут им устройства, которые синтезируют голос, используя активность их мозга. Специалисты из Калифорнийского университета в Сан-Франциско улучшили эту технологию и добавили возможность для воспроизведения слов после анализа движения человеческих губ. Прослушать синтезированную речь можно уже сегодня.
Устройство будет ориентироваться на движение человеческого рта и мысли человека. Чтобы понять, какие области мозга начинают работать при конкретных движениях ртом, исследователи решили привлечь 5 добровольцев. Людям прочли несколько отрывков из сказок для детей. Более того, испытуемым внедрили в мозг электроды, считывающие их мозговую активность.
В результате исследователи создали пару нейронных сетей. Одна из них занималась согласованием сигналов мозга с движениями человеческих губ, а вторая синтезировала из этих движений речь. Примерно 69 % синтезированных слов звучат ясно, а добровольцы сумели повторить отрывки из предложений.
Значительно улучшить технологию можно посредством применения имплантов, вживляемых в мозг. Эти импланты должны обладать плотным расположением электродов и управляться алгоритмами машинного обучения. Исследователи обнаружили, что разные участки мозга реагируют схожим образом. Более того, они выяснили, что ИИ-технология может распознавать звуки, которые не были использованы во время обучения.
Комментарий Агентства Искусственного Интеллекта: это невероятно! Мы должны помочь немым людям начать полноценно контактировать с этим миром. Поэтому использование таких технологий обязательно. Каждый человек заслуживает обладать речью и общаться с людьми вокруг.
Источник: Hi-News.