Найти тему
DigEd

Как искусственный интеллект может помочь универсализировать доступ к цифровому контенту

Оглавление

Авторы Хун Чжоу, Сильвия Иззо Хантер

Более 1 миллиарда человек во всем мире имеют некоторые виды инвалидности (в том числе нарушения зрения, слуха, когнитивные функции, способности к обучению, подвижность и другие), которые влияют на то, как они получают доступ к цифровому контенту. Неудивительно, что мы тратим так много времени на разговоры об инструментах доступности!

-2

Цифровая трансформация может произвести революцию в мире, превратив его в инклюзивное место для людей с ограниченными возможностями и без них, с доступностью, основанной на искусственном интеллекте. В этом посте представлен обзор того, как ИИ может улучшить доступность различными способами, проиллюстрированный реальными приложениями и примерами.

ИИ и доступность: здесь и сейчас

Искусственный интеллект — это широкий набор технологий, в которых машины используют вычислительные возможности, чтобы «думать» как люди. Как мы уже объясняли в другом месте, ИИ создает ценность из больших данных и доставляет ее клиентам через облако. Существует множество различных типов инструментов ИИ, каждый из которых решает разные задачи. Хотя не все перечисленные инструменты были разработаны для решения проблем с доступностью, они все же предоставляют решения для специальных возможностей!

Инструменты компьютерного зрения, такие как Seeing AI от Microsoft, позволяют компьютерам понимать цифровые изображения или видео, что может помочь людям с нарушениями зрения и тем, кто испытывает трудности с пониманием визуального контента.

Инструменты распознавания речи, такие как Siri от Apple, позволяют компьютерам понимать и воспроизводить человеческую речь, что может быть очень полезно для людей с нарушениями слуха или ограничениями подвижности.

Графы знаний, такие как графы знаний Google, объединяют различные типы знаний, что помогает машинам понимать семантическое значение контента, а не только отдельные слова, и, таким образом, позволяет людям с ограниченными возможностями обучения лучше понимать контент.

Инструменты обработки естественного языка, такие как ChatGPT от Open AI, позволяют машинам обрабатывать и понимать текстовый контент не только для улучшения качества письма, но и для идентификации и извлечения ключевой информации, которую можно использовать для автоматизации обработки контента, чтобы избежать человеческих ошибок.

Инструменты поиска информации, такие как рекомендации продуктов Amazon, нацелены на соответствующий контент, продукты и рекламу для отдельных клиентов, понимая их поведение и интересы в Интернете. Это означает, что сайт может отображать более актуальную информацию для людей напрямую, без дополнительного поиска, набора текста и кликов.

Искусственный интеллект для доступности

Давайте рассмотрим некоторые полезные и реальные приложения ИИ для улучшения доступности.

Задача: доступ к тексту и другим визуальным материалам

Более 2,2 миллиарда человек во всем мире имеют те или иные нарушения зрения, начиная от трудностей с визуализацией контента и заканчивая пониманием определенных форм визуального контента.

-3

Решения

ИИ может улучшать или преобразовывать контент в другие форматы, которые легче получить и понять, включая текстовые альтернативы, преобразование текста в аудио и улучшение изображений.

ВАРИАНТЫ ТЕКСТА (АЛЬТЕРНАТИВНЫЙ ТЕКСТ)

Альтернативный текст описывает внешний вид или функцию изображения и может быть прочитан вслух программами чтения с экрана, чтобы помочь слабовидящим пользователям понять содержание вашей страницы. (Это также может улучшить SEO). ИИ может автоматически генерировать замещающий текст для описания изображений. Microsoft Edge, Amazon и Google Chrome уже могут автоматически генерировать замещающий текст для многих простых изображений, но они плохо работают со сложными изображениями. Тем не менее, последние и будущие большие модели ИИ, такие как ChatGPT 4 от Open AI, могут понимать и описывать сложные научные изображения намного лучше, чем раньше, благодаря их мультимодальным возможностям, которые могут понимать текст, изображения и видео вместе.

ТЕКСТ НА АУДИО

Многие компьютеры и другие устройства имеют встроенное программное обеспечение для преобразования текста в речь, а программное обеспечение для чтения с экрана обеспечивает важные функции, такие как навигация по заголовкам.

Microsoft, Google и Samsung предоставляют бесплатные приложения, помогающие людям с нарушениями зрения рассказывать об окружающем мире.

Помимо управления всеми этими инструментами, ИИ можно использовать даже для создания аудио на разных языках и с разными акцентами!

УЛУЧШЕНИЕ ИЗОБРАЖЕНИЯ

ИИ может автоматически увеличивать контрастность изображений или улучшать разрешение и качество изображения. Это помогает пользователям со слабым зрением или плохой контрастной чувствительностью, автоматически увеличивая контрастность или улучшая разрешение и качество изображений для улучшения читаемости. Кроме того, некоторые ИИ-решения могут автоматически извлекать части фигуры из составной фигуры. Отображение подрисунков и соответствующих подзаголовков позволяет читателям сосредоточиться на конкретных изображениях, меньше отвлекаясь.

Segment Anything — это решение для искусственного интеллекта, недавно выпущенное Meta, основной целью которого было создание модели сегментации изображений с подсказками, которая будет работать с подсказкой ввода пользователя, такой как ChatGPT. Проект состоит из трех столпов: задача, модель и данные. Модель Segment Anything Model (SAM) может использоваться в приложениях, требующих идентификации, сегментации и уточнения объектов в любом изображении. У него есть потенциал для улучшения качества изображения и обнаружения изображений.

Задача: доступ к аудиоконтенту

Приблизительно 20% населения мира имеют ту или иную степень нарушения слуха, и слух может оказывать большое влияние на доступность.

-4

Решения

ЗАГОЛОВКИ И ТРАНСКРИПТЫ

ИИ может генерировать субтитры и расшифровки аудио- и видеоконтента, чтобы обеспечить лучший доступ для людей с нарушениями слуха или когнитивными нарушениями, а также для тех, кто слушает на втором или дополнительном языке. Поскольку транскрипты являются машиночитаемыми и могут быть проиндексированы поисковыми системами, они также могут повысить вероятность обнаружения аудио- и видеоконтента.

На данный момент это одно из самых сложных и широко используемых приложений искусственного интеллекта в мире, которое во многих случаях работает точнее и быстрее, чем человек.

КАЧЕСТВО ЗВУКА

Разговор в шумной обстановке может быть затруднен. ИИ может помочь людям слышать более четко, улучшая речь и подавляя другие шумы. Посмотрите эту демонстрацию от Google.

Задача: доступ с ограничениями подвижности

В Соединенных Штатах 11% населения имеют ту или иную форму нарушения подвижности. Для пользователей с ограниченной подвижностью, ловкостью или силой важно иметь возможность взаимодействовать с контентом в иммерсивной среде, которая не требует движения тела.

-5

Решение: голосовой доступ и управление

Голосовой доступ и управление на базе ИИ — незаменимый помощник для людей с ограниченной подвижностью. Google, Apple и Microsoft предоставляют голосового помощника для управления устройством, позволяя людям просматривать веб-сайты, новости, видео и информацию без прикосновения или движения тела.

Голосовая помощь будет играть большую роль в доступности и поиске информации в будущем. По состоянию на 2022 год более 120 миллионов взрослых в США используют умного помощника не реже одного раза в месяц.

-6

Последние продукты искусственного интеллекта, такие как плагин ChatGPT и AutoGPT, становятся более самодостаточными и могут планировать, выполнять задачи и учиться на них самостоятельно. Они могут получать доступ к актуальной информации, вызывать другие службы и агрегировать результаты для различных целей. Такие инструменты ИИ могут сделать голосовую помощь еще более интеллектуальной, а это означает, что пользователям больше не нужно будет давать точные пошаговые инструкции, а можно будет просто описать задачу, предоставив ИИ просчитать необходимые шаги и получить желаемый результат. Голосовая помощь станет еще более мощной, когда в будущем искусственный интеллект будет интегрирован с роботами, чтобы оказывать разнообразную помощь и поддержку людям с ограниченными возможностями.

Задача: повышение удобочитаемости и понимания

Информационная перегрузка замедляет способность каждого принимать своевременные решения. Слишком много нужно читать и понимать в нашу нынешнюю эпоху массовой информации. Людям с когнитивными нарушениями или нарушениями обучения, а также с нарушениями языка и памяти может быть трудно читать, понимать и обрабатывать контент. (Например, 9-12% населения мира страдают дислексией.)

-7

Решения: структурированный, привлекательный и сфокусированный контент

ИИ может помочь улучшить обучение и знания, автоматически создавая более структурированный, привлекательный и целенаправленный контент.

Например, ИИ может генерировать изображения на основе текстовых описаний. Отличные визуальные эффекты могут помочь лучше общаться, привлечь наше внимание и улучшить понимание. Двумя наиболее популярными инструментами преобразования текста в изображение на основе искусственного интеллекта являются Dall•E 2 и Stable Diffusion. К сожалению, инструменты ИИ также можно использовать для обработки научных изображений для публикаций.

-8

Чтобы помочь исследователям лучше и быстрее понять опубликованные статьи, Wiley (полное раскрытие: работодатель авторов) разработала службу ИИ, которая автоматически генерирует структурное резюме, содержащее ключевые моменты каждого раздела в полном тексте. Этот реферат облегчает исследователям понимание высокоуровневой информации статьи, читая только краткое резюме.

Службы извлечения знаний, которые извлекают ценную информацию из существующего контента клиентов для создания более структурированного контента, который людям легче читать, помогают издателям выявлять и создавать новые возможности монетизации.

Задача: обнаружение и распространение

В то время как исследователи борются с информационной перегрузкой, издатели сталкиваются с проблемами распространения контента.

Решения

ОБОГАЩЕНИЕ СОДЕРЖАНИЯ

ИИ может улучшить обнаружение и читаемость контента, преобразовывая плоские, устаревшие, основанные на изображениях PDF-файлы в индексируемые, доступные для поиска и более удобные для исследователей данные.

ИИ также может переводить контент на разные языки, чтобы улучшить его читабельность и возможность обнаружения.

ПОИСК МУЛЬТИМЕДИЙНОГО КОНТЕНТА

Поиск мультимедийных тем, поиск изображений, поиск видео и поиск спонсоров жизненно важен для обнаружения контента, но многие академические издатели не имеют доступных метаданных. Инструменты искусственного интеллекта могут автоматически извлекать соответствующие метаданные из мультимедийного контента, чтобы сделать его доступным для обнаружения.

ПЕРСОНАЛЬНЫЕ РЕКОМЕНДАЦИИ

ИИ может сделать рекомендации по контенту более актуальными для вашей аудитории. Мы все знакомы с моделью «люди, которые читают эту статью, также читают эти», и это одно из самых распространенных применений ИИ. ИИ также может предлагать подходящих экспертов и контент на основе их опыта и включать персонализированные новостные ленты на основе индивидуальных интересов пользователей.

В целом, обнаружение информации развивается от нечеткого сопоставления к семантическому сопоставлению и, в конечном итоге, к точной генерации информации. Акцент смещается с предоставления релевантных результатов на получение точных ответов с доказательствами благодаря недавнему успеху генеративного ИИ. ИИ не только значительно повышает качество результатов поиска, но и вводит новые формы обнаружения информации, такие как диалоговый поиск и генерация персонализированных результатов. Это не только позволит пользователям находить ответы быстрее, чем когда-либо прежде, но также позволит издателям создавать и публиковать оригинальный контент на основе существующих материалов, чтобы увеличить как охват, так и доход.

Задача: ошибки

Человеческие ошибки, допущенные во время подачи и далее, такие как неоднозначная информация об авторе, членстве и спонсоре, могут значительно снизить качество публикации и негативно сказаться на возможности обнаружения и удобочитаемости.

Решения: извлечение и проверка информации

Инструменты, которые автоматически извлекают полезную информацию и обеспечивают автоматическую проверку и отправку, могут уменьшить количество ошибок при вводе данных.

Например, когда системы рецензирования интегрируют инструменты на основе ИИ (например, ReX Submission, eXtyles Arc), авторам больше не нужно вручную заполнять форму, а вместо этого просто просматривать и проверять данные, автоматически извлеченные из загруженного файла статьи. Подобные инструменты не только улучшают взаимодействие с пользователем, но и повышают точность за счет сведения к минимуму ошибок ввода данных. Эти передовые инструменты искусственного интеллекта могут еще больше снизить количество человеческих ошибок или улучшить качество публикации за счет автоматизации набора текста и редактирования текста. Они могут помочь с форматированием, а также проверить грамматику, проверить согласованность и обеспечить соблюдение руководств по стилю. Однако такой инструмент ИИ не заменяет людей-экспертов: предложения, созданные ИИ, всегда должны проверяться опытными редакторами для обеспечения качества и точности.

Будущее доступности и ИИ

Мы все должны хотеть сделать наш контент доступным для всех, кто в нем заинтересован, но также внедряются политики, чтобы гарантировать, что это произойдет. Европейский закон о доступности 2019 года потребует, чтобы к 2025 году широкий спектр онлайн-контента и услуг соответствовал требованиям доступности, и теперь настала очередь частного сектора активизироваться. Переходя от доступности к публичному доступу, недавний «Памятка Нельсона» Управления по научно-технической политике требует бесплатного публичного доступа ко всем исследованиям, финансируемым правительством США, что делает доступность еще более важной: контент, который находится в открытом доступе, но не соответствует руководящим принципам доступности. не так доступен для публики, как должен быть.

Издатели могут приступить к выполнению этих требований, используя Рекомендации W3C по доступности веб-контента (WCAG), которые содержат стандартные показатели и рекомендации по доступности. В нем представлена модель для оценки того, насколько веб-контент и приложения доступны для людей с широким спектром ограниченных возможностей, и определены цели для улучшения. Следование рекомендациям W3C по обеспечению доступности часто улучшает взаимодействие с пользователем не только для пользователей с ограниченными возможностями, но и для обычных пользователей.

Инструменты на базе ИИ — это один из способов улучшить доступность. Но создание доступного контента и систем требует совместных усилий, в которых участвуют издатели, специалисты по продуктам, технические специалисты, дизайнеры и другие команды.

-9

При этом необходимо учитывать множество важных аспектов, таких как веб-дизайн, UX, регулярные проверки доступности и вклад редакторов, авторов и наборщиков. Благодаря этому сотрудничеству интеграция инструментов на основе искусственного интеллекта может помочь нам создать инклюзивное место, где каждый может получить доступ к научному контенту.

Источник