Найти в Дзене
ТехноВзгляд

Новые очки могут транскрибировать речь в реальном времени

Оглавление

Очки, обеспечивающие субтитры при разговоре, могут стать находкой для людей с нарушениями слуха

Когда в прошлом году Пол Шаттлворт купил себе на Рождество очень дорогие очки, это был необычный подарок. Очки не улучшали его зрение, не были особенно стильными и неудобно давили на нос, эти очки стали для него жизненно необходимым инструментом.

40-летний Шаттлворт, житель Манчестера (Англия), глубоко глух на оба уха и использует мобильное приложение для расшифровки аудиозаписей в качестве основного средства общения. Но очки помогли ему говорить и участвовать в беседах так, как он никогда не мог раньше. Эти модные очки автоматически транскрибируют слова собеседника и отображают текст в виде субтитров на линзах перед его глазами.

Очки с живыми субтитрами уже на слуху, и за последние несколько лет целый ряд компаний выпустил их собственные версии. Эти высокотехнологичные очки могут помочь глухим и слабослышащим людям более эффективно общаться со слышащими. Однако они не совершенны и никогда не смогут полностью заменить человека-переводчика.

В июле Том Прицки, соучредитель компании TranscribeGlass, выложил на TikTok видеоролик, в котором демонстрировал, как очки его компании с живым субтитром выдают субтитры на произнесенные им слова, и этот ролик стал вирусным. Для Прицки, страдающего двусторонней тугоухостью средней и тяжелой степени, эти очки - не просто технологическая причуда. Они активно улучшают качество его жизни и способность общаться с людьми.

"Это помогает мне заполнять пробелы"

Он также носит слуховые аппараты.

"Слуховые аппараты передают мне звук, но он нечеткий, и я пропускаю слова. Если я могу восполнить некоторые из этих слов с помощью субтитров, то это помогает мне продолжать понимать разговор и не терять нить."

Благодаря усовершенствованию технологии распознавания речи и увеличению времени автономной работы на рынке начинают появляться очки с живыми субтитрами. По прогнозам, к 2050 году около 2,5 млрд. человек будут иметь ту или иную степень потери слуха. По мнению экспертов, наиболее вероятно, что эти очки пригодятся пожилым людям с нарушениями слуха. Многие пожилые люди нуждаются в слуховых аппаратах, но не носят их из-за стигматизации и трудностей с адаптацией к этой технологии. Очки с живым текстом часто напоминают обычные очки, которые уже более нормализованы в обществе, чем слуховые аппараты.

По словам Тада Старнера, профессора информатики из Технологического института Джорджии, предоставление пожилым людям с возрастными нарушениями слуха доступа к живым субтитрам может улучшить их социальные отношения с семьей и друзьями. В начале 2010-х годов Старнер участвовал в разработке Google Glass, ныне снятого с производства устройства, напоминающего очки, которое проецировало информацию на крошечную призму перед глазами пользователя.

ПЕРЕЛОМНЫЙ МОМЕНТ

Субтитры в реальном времени - не совсем новая технология. Глухие и слабослышащие люди регулярно пользуются такими приложениями, как Otter, для расшифровки разговора в процессе его ведения. Однако необходимость переключаться между собеседником и телефоном может быть неприятной и утомительной. По словам Прицки, наличие субтитров в поле зрения меняет ситуацию.

Большинство очков с живыми субтитрами состоят из самих очков, миниатюрного микрофона, встроенного компьютера для обработки речи, аккумулятора и способа отображения текста. Некоторые очки содержат все эти компоненты, в то время как другие устройства устанавливаются поверх обычных очков. По словам Дэна Скарфа, генерального директора компании XRAI Glass, создающей приложение для обработки речи, которое может использоваться с различными очками с поддержкой живого текста, совершенствование программного обеспечения для распознавания речи стало реальным стимулом для этих технологических достижений.

"Я не думаю, что пройдёт более полугода, прежде чем у нас появится аппаратное обеспечение, которое можно будет использовать для этих целей. Тогда остается только найти людей, которые захотят его использовать."


Несмотря на шум в прессе, было продано относительно небольшое количество очков с живым переводом. По словам Скарфа, более 5000 человек участвуют в пилотной программе XRAI Glass, а Прицки говорит, что "тысячи" заказали TranscribeGlass.

Тем не менее, эти продажи представляют собой значительный шаг вперед для технологии, говорит Старнер, который участвует в этой области с самого ее зарождения. Старнер, любитель носимых компьютеров, уже 30 лет почти каждый день носит на голове тот или иной дисплей.

"Раньше, чтобы иметь дисплей на голове с хоть каким-то сроком службы батареи, приходилось носить с собой около семи фунтов свинцового груза"

Старнер обычно носил батарею в наплечной сумке.

"Буквально, моим первым аккумулятором был мотоциклетный аккумулятор".

За последние три десятилетия Старнер видел много технологических неудач. Но сейчас он считает, что нынешние технологии многообещающие и что очки с живым переводом скоро станут нормальной бытовой технологией благодаря более портативным батареям и усовершенствованию системы распознавания речи. Для того чтобы это произошло, необходимо, чтобы отношение общества к очкам продолжало меняться. По его словам, устройства должны стать неприметными. Допустим, я подхожу к кому-нибудь в аэропорту и спрашиваю: "Могу ли я узнать, как пройти в туалет?" А человек отвечает: "О, это новый дисплей Apple на голове?". На самом деле вы хотите добраться до туалета. Вы хотите, чтобы разговор был о разговоре, а не о технологии", - говорит Старнер.

ВАЖНЫЙ, НО НЕСОВЕРШЕННЫЙ ИНСТРУМЕНТ

Хотя очки с живыми субтитрами могут стать невероятно мощным инструментом для миллионов людей, они не являются полным решением проблемы. Для многих людей с потерей слуха понимание слышащего друга в переполненном ресторане - сущий кошмар. Аналогичным образом, программное обеспечение с живым переводом не может точно передать разговор в таких помещениях. Фоновый шум остается острой проблемой, которую очки пока не решают полностью.

Многие глухие и слабослышащие люди рады этой технологии, но некоторые видят в ней угрозу для запросов на услуги сурдопереводчиков. Сурдоперевод не отображает личность говорящего, его эмоции и интонации; все это могут передать устные переводчики.

По словам Раджи Кушалнагара, профессора и директора программы по информационным технологиям в Университете Галлаудет, эти очки также возлагают бремя общения на тех, кто ими пользуется, - ожидания, которые глухие люди уже устали выполнять. Слышащий человек может подумать: "Что с тобой не так? Что не так с очками?" - говорит он.

"Они думают, что проблема не в инструментах, а в самих глухих".


Эти очки - в основном инструмент для взаимодействия со слышащей публикой - глухие, которые в основном используют язык жестов, в них не нуждаются. Но Кушалнагар уже увидел, как эта технология влияет на его повседневную жизнь, когда он общается со своим слышащим сыном.

"Допустим, я сейчас готовлю - нарезаю овощи или что-то еще на кухне. Я смогу читать субтитры, пока буду резать. Раньше я бы никогда не смог так разговаривать со своим сыном. Теперь я могу ходить и одновременно разговаривать с сыном".


Когда несколько лет назад Шаттлворт сдавал экзамен на получение профессии техника по информационным технологиям, он сдал его с отличием, поскольку ему были предоставлены средства, необходимые для понимания информации. Сейчас Шаттлворт использует очки вместе с мобильным приложением на своей работе. Он очень жалеет, что в детстве ему не были доступны эти средства, которые могли бы изменить всю его дальнейшую жизнь.

"Если бы у меня было это мобильное приложение и очки, я бы сейчас не сидел здесь и не разговаривал с вами."