Представьте, что вы звоните в банк, чтобы взять кредит. Программа по вашему голосу автоматически определяет, что у вас повышен риск сердечного приступа и банк выдает вам более высокий процент.
Голоса очень индивидуальные, их трудно подделать, и они содержат удивительную информацию о нашем психическом здоровье и поведении.
Компания VOicesense говорит: дайте нам чей-то голос, и мы расскажем вам, что его обладатель собирается делать. Израильская компания использует голосовой анализ в режиме реального времени во время звонков, чтобы оценить, собирается ли кто-то пропустить платеж по банковскому кредиту, купить более дорогой продукт, голос же поможет определить лучшего кандидата на работу.
В последние годы исследователи и стартапы приняли к сведению богатую информацию, которую можно добывать из голоса, особенно потому, что популярность голосовых помощников, таких как Alexa, Алиа, Сири, стабильно растет. Рынок голосовых технологий, как ожидается, достигнет $15,5 млрд к 2029 году, согласно отчету компании business analytics IdTechEx. "Есть множество устройств, которые захватывают голос, будь то ваш телефон или такие устройства, как Alexa и Google Home”, - говорит Сатраджит Гош, ученый-исследователь в Центре исследований мозга MIT, который заинтересован в разработке анализа голоса для целей диагностики психического здоровья.
Здоровье
Голос очень трудно подделать. Цифровые голосовые помощники все чаще используются в больницах. К настоящему времени многие люди знают, что твиты и сообщения в Instagram отслеживаются, но мало кто думает о наших голосах, как о еще одной форме данных, которая может рассказать нам многое о нас самих. Все это привело к захватывающим исследованиям о том, как эта информация может обогатить нашу жизнь.
Ключ к голосовому анализу - это не то, что кто-то говорит, а то, как они говорят: тоны, скорость, акценты, паузы. Хитрость заключается в машинном обучении. Возьмите маркированные образцы из двух групп-скажем, людей с беспокойством (А) по сравнению с людьми без- (группа Б) и загрузите эти данные в алгоритм. Затем алгоритм учится подбирать тонкие знаки, которые могут указывать, является ли кто-то частью группы A или группы B, и он может сделать то же самое на новых образцах в будущем.
Результаты иногда могут быть противоречивыми, говорит Луи-Филипп Morency, компьютерный ученый в Университете Карнеги-Меллон, который создал проект под названием SimSensei. SimSensei может помочь обнаружить депрессию с помощью голоса. В некоторых ранних исследованиях, ученые пытались сопоставить вокальные черты и выявить вероятность попытки самоубийства. Это исследование является предварительным. Как правило, анализ голоса - это сложный набор функций и речевых шаблонов, которые могут подобрать только алгоритмы. Но на основе них уже сейчас:
"МОЖНО ПРЕДОСТАВИТЬ ПРОГНОЗЫ О ПОВЕДЕНИИ ЗДОРОВЬЯ, РАБОЧЕМ ПОВЕДЕНИИ, РАЗВЛЕЧЕНИЯХ”
Исследователи уже построили алгоритмы, которые используют голос, чтобы помочь идентифицировать все, от болезни Паркинсона до посттравматического стрессового расстройства. Для многих, величайшее обещание этой технологии находится на пересечении анализа голоса и психического здоровья и надежды на создание простого способа контролировать и помогать тем, кому грозит рецидив.
Люди с проблемами с психическими состояниями здоровья тщательно контролируются, когда они находятся в больнице, но “многое из того, что происходит с психическими состояниями здоровья, происходит в повседневной жизни", - говорит Дэвид Ахерн руководитель программы "цифровое поведенческое здоровье". Он говорит, что за пределами контролируемой ситуации, повседневная жизнь может истощать людей медленно и тонко. В такой ситуации человек, у которого однажды диагностировали депрессию, может даже не понять, что он снова впал в депрессию. “Эти события происходят, когда люди не связаны с какой-либо системой здравоохранения и помощь может прийти слишком поздно. Идея наличия датчика в кармане, который мог бы контролировать соответствующие поведенческие качества, довольно эффективна в концептуальном плане. Это может быть система раннего предупреждения.”
Пациенты записывают аудио- дневники с помощью приложения. Программа анализирует эти дневники вместе с метаданными, такими как журналы вызовов и местоположение, чтобы определить, как пациент оценивает четыре фактора — подавленное настроение, уменьшенный интерес, избегание и усталость — и отслеживает изменения с течением времени. Эта информация, которая защищена Федеральным законом о конфиденциальности, передается в приборную панель к врачу, который ведет наблюдение за состоянием пациента.
Компания тестировала продукт в течение семи лет и с более чем 1500 пациентами. Итоги показывают, что технология может предсказать симптомы депрессии и ПТСР, хотя необходима дальнейшая проверка.
Бизнес
Компании, такие как Voicesense, CallMiner, RankMiner, и компания CompanionMx одноразовая материнская компания Cogito обещает использовать голосовую аналитику в бизнес-контексте. В большинстве случаев это означает улучшение взаимодействия с клиентами в центрах обработки вызовов, но у Voicesense есть большие мечты. "Сегодня мы можем создать полный профиль личности", - утверждает генеральный директор Yoav Degani. Его планы выходят за рамки умиротворения недовольных клиентов. Его компания заинтересована во всем: прогнозах дефолта по кредиту, прогнозах страховых выплат, выявлении инвестиционного стиля клиентов, оценке кандидатов в HR, оценке вероятности увольнения сотрудников. “Мы не уверены в 100% случаев, но процент правильных прогнозов очень высок”, - говорит Дегани. "Мы можем дать прогнозы о здоровье, рабочем поведении, развлечениях и т.д.”
Voicesense проверил свою технологию с большим европейским банком. Банк предоставил голосовые образцы от нескольких тысяч должников. (Банк уже знал, кто имел и кто не допустил просрочку по их кредитам.) Voicesense запустил свой алгоритм на этих образцах и классифицировал записи на низкий, средний и высокий риск. Результаты впечатлили.
"ЧТО ПРОИСХОДИТ, КОГДА АЛГОРИТМЫ ОШИБАЮТСЯ?”
Это все правдоподобные приложения, говорит Гош, ученый MIT. Для него ничто не является красным флагом. Но, как и в случае с любой прогностической технологией, легко переусердствовать, если анализ не сделан хорошо. "В общем, пока я не увижу доказательства того, что что-то было подтверждено на X число людей и это разнообразное население, мне было бы очень трудно принять чье-то требование как должное”, - говорит он. "Голосовые характеристики могут немного отличаться, если вы не пробовали достаточно, поэтому мы держимся подальше от очень сильных претензий.”
Со своей стороны, Дегани говорит, что алгоритм обработки речи Voicesense измеряет более 200 параметров каждую секунду и может быть точным на многих разных языках, включая тональные языки, такие как Мандарин. Программа пока находится на пилотном тестировании, но компания находится в контакте с крупными банками, говорит он, и другими инвесторами. "Все очарованы потенциалом такой технологии.”
Нарушение прав?
Профессор криминологии в Университете Дрекселя, обеспокоен тем, что некоторые из приложений, которые voicesense предполагает, могут быть дискриминационными. Представьте себе, что вы звоните в ипотечную компанию, говорите, и они используют ваш голос, чтобы определить, что вы подвержены более высокому риску сердечных заболеваний, а затем вам дают более высокий процент. "Я действительно думаю, что у нас будет законодательство о защите прав потребителей, созданное для защиты от сбора такой информации”, - добавляет Д'Овидио.
Некоторые такие средства защиты прав потребителей, уже существует, указывает Райан Кало, профессор Школы права Университета Вашингтона. Голос считается биометрической мерой, и в некоторых странах, уже есть законы, которые гарантируют биометрическую безопасность.
Мнения специалистов:
"Я надеюсь, что по мере того, как мы продвигаемся вперед, мы признаем, что это просто данные, независимо от того, в какой форме они находятся, как набор чисел и текста, набранных в электронной таблице или запись голоса. Как минимум, мы должны требовать, чтобы нам сказали, когда используется что-то подобное."
"И я хотел бы видеть движение к регулированию с точки зрения защиты потребителей”, - говорит он. "Что происходит, когда алгоритмы ошибаются?”
Расшифровка и переводы: https://swan-swan.ru/rasshifrovka-vyorstka-dizayn/