Найти тему
ПостНаука

Цифровые технологии, помогающие людям с нарушениями зрения

Ассистивные технологии — это разработки, которые позволяют людям с особенностями здоровья более эффективно взаимодействовать с окружающими, учиться и вести повседневную жизнь. Постнаука разобралась в том, как технологии компьютерного зрения, распознавания текста и синтеза речи помогают незрячим людям воспринимать мир вокруг.

Этот материал — часть проекта «Мир особенного ребёнка». Партнер проекта — благотворительный фонд «Абсолют-помощь».

Технологии, на которых основаны решения для людей с нарушениями зрения

В большей части сервисов для незрячих людей используются следующие разработки:

— Компьютерное зрение

— Автоматическая обработка текста

— Синтез речи

Компьютерное зрение (CV) — это область искусственного интеллекта, которая занимается анализом изображений и видео. Она включает в себя методы, наделяющие компьютеры способностью извлекать информацию из увиденного.

Благодаря компьютерному зрению незрячие люди могут получать информацию об окружающих объектах, не видя их: специальные приложения могут распознать предметы на картинке с камеры смартфона и озвучить их основные характеристики.

Кроме того, существуют портативные устройства, которые слабовидящие люди могут брать с собой на улицу одновременно с тростью и собакой-поводырем или вместо них. Они помогают избежать столкновений и сделать прогулки более безопасными для слепых. Исследования показали, что некоторые такие девайсы могут снизить вероятность столкновения на 37%.

Автоматическая обработка текста (Natural Language Processing или NLP) — это часть науки о данных, которая специализируется на работе с текстами. За счет нее можно производить мгновенный перевод привычного нам текста в шрифт Брайля. Так, для слепых существуют особые планшеты с меняющимся рельефом экрана: выпуклыми точками, заменяющими буквы.

Синтез речи позволяет озвучивать текст, появляющийся на экране, а также используется в голосовых помощниках. Однако универсальные голосовые помощники зачастую не адаптированы под нужды незрячих людей, так как обучаются на массиве данных пользователей, среди которых может и не быть людей с ОВЗ. В связи с этим для них создают дополнительные расширения: например, в Alexa, ассистенте от Amazon, есть Amazon Echo — дополнение, которое позволяет распознавать распространенные продукты с помощью камеры телефона.

Сервисы для людей с нарушениями зрения

Одно из таких приложений — скринридер. Скринридер преобразует происходящее на экране в текст при помощи технологии распознавания объектов, а затем озвучивает его. Так, скринридеры могут описать расположение изображений на экране, их содержание и другую важную информацию.

Технологии компьютерного зрения важны и для других сервисов: например, распознаватели объектов определяют, какие предметы расположены вокруг человека, и помогают ему ориентироваться в окружающем пространстве. Все, что нужно для их работы — это действующая камера смартфона.

Голосовые помощники выполняют команды незрячего человека и помогают ему находить необходимую информацию. А синтезаторы речи преобразуют письменный текст в речь. Тифлокомментирование (специальные описания для незрячих) применяют, например, в инклюзивных музеях и других публичных пространствах: оно призвано помочь слепым людям полно воспринимать происходящее вокруг них.

Также существуют приложения, где слепые люди могут получить помощь от зрячих: к примеру, Be My Eyes. Зрячий собеседник может помочь с описанием окружающей среды, с которым пока не справляются алгоритмы, и поддержать пользователя в решении бытовых задач.

А о будущем адаптивных технологий для незрячих вы можете узнать в полном материале.