Найти тему
EverCare

Устройство, которое преобразует мысли в речь

Новое устройство класса "интерфейс мозг-компьютер" расшифровывает мозговую активность, чтобы понять, что пытается сказать пользователь, и использует эти данные для синтеза обычной человеческой речи в виде полноценных предложений.

Устройство пока далеко от совершенства и исследование еще находится на ранней стадии, но этот прибор впервые сумел воссоздать полное предложение таким образом, что оно было понятно кому-то другому. И этот проект дает "искорку надежды" для людей, потерявших способность общаться вследствие инсульта, бокового амиотрофического склероза или других заболеваний.

Информация об этом исследовании была опубликована в журнале Nature.

Устройство, которое преобразует мысли в речь
Устройство, которое преобразует мысли в речь

Исследователи из Калифорнийского университета Сан-Франциско обнаружили, что попытка напрямую перевести сигналы мозга в слышимую речь была слишком сложной. Вместо этого они использовали искусственный интеллект для сопоставления сигналов, посылаемых мозгом в голосовой тракт участников исследований, которые соответствовали определенному словарному запасу, моделируя поведение голосовой системы человека для генерации реалистично звучащих слов. Во время пробного запуска устройство смогло синтезировать речь, в то время как люди произносили слова молча.

Устройство, которое преобразует мысли в речь
Устройство, которое преобразует мысли в речь

Люди, которые слушали и пытались расшифровать то, что транслировала система, неправильно понимали эти "слова" более, чем в половине случаев, но тот факт, что они хотя бы иногда понимали их правильно, свидетельствует о существенном прогрессе по сравнению с существующими системами.

Устройство, которое преобразует мысли в речь
Устройство, которое преобразует мысли в речь

Как сказал нейроинженер Северо-западного университета Марк Шлюцки, который занимался аналогичными проектами,

Для тех, кто заблокирован внутри себя и вообще не может общаться, некоторое количество мелких ошибок вполне допустимо. Понятно, что они хотели бы легко произносить любое слово, но это все равно намного лучше, чем вводить слова по одной букве за раз, что соответствует текущему уровню технологий.