Найти тему
Особый взгляд

Как незрячие люди определяют, что изображено на фотографии?

Оглавление
«Иногда мне нужно подобрать иллюстрацию для своих публикаций в соцсетях, тогда я ищу фотографии в фотобанках. Там есть скудные, но все-таки описания».
Иллюстрация: Галина Воробьева
Иллюстрация: Галина Воробьева

«Особый взгляд» запустил проект «100 вопросов незрячему». В его рамках незрячие люди отвечают на вопросы людей без нарушения зрения — даже на те, которые могут показаться странными или банальными.

Присылайте свои вопросы по адресу:  editor@specialview.org.

Маргарита Мельникова, незрячая с рождения

«Самый очевидный ответ — попросить зрячего друга или родственника рассказать о том, что изображено на фото. Но описывать изображение хотят, а самое главное — умеют, далеко не все. Тогда на помощь приходит искусственный интеллект: есть плагины и приложения, которые умеют определять, что находится на фотографии. Примеры таких приложений: Envision, Seeing AI, TapTapSee, из плагинов — Cloud Vision и VisionBot. Кстати, VisionBot разработал молодой незрячий программист.

Мы загружаем фото в приложение и получаем описание, которое незрячий человек может прочитать благодаря программам экранного доступа и синтезатору речи. Программы экранного доступа переводят текст в речь, а синтезатор этот текст озвучивает.

Но у этого способа ''просмотра'' фотографий есть один большой недостаток: искусственный интеллект несовершенен, он только учится составлять описания, получается у него слишком коротко и не всегда удачно.

Например, искусственный интеллект может составить такое описание: "Мужчина, примерно 40 лет, довольный, улыбается". Или: "Дерево, группа людей, здание, автомобиль". Возраст алгоритм часто определяет неправильно, мальчика может перепутать с девочкой. Искусственный интеллект также может неправильно определить животное или объект, даже самый типичный. Например, увидеть стол вместо кровати. Полностью на такие описания полагаться не стоит. Искусственный интеллект поможет незрячему определить на фотографии какие-то самые общие элементы.

Гораздо более удобный способ — воспользоваться помощью зрячих волонтеров. Есть два проекта, где волонтеры будут рады подробно и красочно описать фотографию незрячему человеку. Первый проект — "Опиши мне'', сооснователем и руководителем которого я, кстати, являюсь. Он существует с февраля 2015 года, у этого проекта есть сайт, страничка "Вконтакте'', а также бесплатное мобильное приложение. Незрячие люди присылают в проект фотографии и видеоролики, а волонтеры делают описания.

Еще один проект — Be My Eyes. Его название переводится, как "Будь моими глазами''. В этом проекте участвуют сотни тысяч волонтеров по всему миру. Чтобы им воспользоваться, нужно установить одноименное приложение, пройти несложную регистрацию и выбрать, кто мы — незрячий пользователь или волонтер. Если мы зарегистрировались, как незрячий пользователь, то в приложении появляется кнопка "Позвонить свободному волонтеру''.

В данном приложении незрячий человек связывается с волонтерами по видео, поэтому важно, чтобы качество интернет-соединения было хорошим и стабильным. Теперь мы можем показать волонтеру фотографию и попросить ее описать. Он едва ли откажется помочь. Сюда можно обращаться с разными просьбами. Например, многие незрячие с его помощью читают квитанции, смотрят показания счетчика.

Волонтеры проекта "Опиши мне'' обучены описывать фотографии и видеоролики, волонтеров Be My Eyes никто не обучает, они просто готовы помочь.

В некоторых соцсетях также есть функция распознавания фото. Но нужно понимать, что они описываются с помощью искусственного интеллекта, поэтому качество оставляет желать лучшего. На iPhone также есть функция описания фотографии, но это тоже искусственный интеллект».

Анастасия Павлюченкова, нарушение зрения с детства

«Самый простой способ — переслать фотографию зрячему, чтобы он описал. Если такого человека нет, то нужно искать другие пути. Есть приложения, которые распознают изображения и текст на фотографии. Я иногда делаю скрины, а потом думаю, что у меня за скрины здесь лежат, тогда я загружаю их в приложение — и оно мне очень хорошо читает текст.

Мы также пользуемся им, когда нужно прочитать что-то на упаковке продукта. Или, например, когда учим с ребенком стихи. Нам дают на бумажке в садике стихотворение, мы приходим, фотографируем лист, а приложение распознает текст.

Если распознать нужно изображение, то это сложнее. Программа может описать, что там изображено, но очень обтекаемо. Не стоит ждать какого-то подробного описания. Программа может сказать, например, что на фото женщина 32 лет в помещении. Конкретных деталей от нее не дождаться. Мы проводили эксперимент, несколько раз распознавали одну и ту же фотографию — и каждый раз программа выдавала разные результаты. Один раз могла сказать, что женщина 28 лет, в другой раз — 30 лет, а затем 32 года. Бывают и казусы.

В Facebook*, например, ничего делать не нужно. Ты заходишь в соцсеть, кто-то из друзей выложил фотографию, алгоритм сразу выдает: "Один человек и природа", "Три человека улыбаются". Иногда он говорит: "Три человека, в том числе, допустим, Руслан, улыбаются". Мне кажется, это действует только в том случае, если человек отмечен на фото.

Иногда мне нужно подобрать иллюстрацию для своих публикаций в соцсетях, тогда я ищу фотографии в фотобанках. Там есть скудные, но все-таки описания. Например: "Бабушка и дедушка с внуками на диване в гостиной". Не очень понятно, сколько внуков и какого они пола, но в целом картина ясна. Хотя бы понятно, что там не дерево или цветок, не машина и не здание, а люди определенного возраста.

Еще один вариант — он хороший, но подходит в том случае, если можно подождать — отправить фото в волонтерский проект "Опиши мне". Они очень подробно описывают, у них есть приличная галерея, где можно даже открытки найти. Там все очень подробно описано, хорошо понятно. Они также расшифровывают видеоролики, дают полное описание».

* социальная сеть принадлежит компании Meta, признана в России экстремистской и запрещена.