Найти в Дзене
Gaze

Что не так с технологиями распознавания эмоций?

Машинное распознавание эмоций человека обещает стать популярным трендом в IT-индустрии. Эксперты полагают, что индустрия распознавания эмоций станет отраслью с оборотом в 25 миллиардов долларов. Некоторые компании рапортуют об успешном решении этой задачи: Люди обладают врожденной способностью распознавать и различать лица. Теперь компьютеры могут делать то же самое. Это открывает множество возможностей. Мы также создали конвейер для обнаружения, распознавания и понимания эмоций на любом изображении с помощью всего 8 строк кода после загрузки изображений! В данных проектах участвуют огромные компании, такие как Microsoft и Apple, а также специализированные стартапы, такие как Kairos и Affectiva. Хотя их наработки чаще всего используются для продаж товаров и услуг, технология распознавания эмоций также используется при найме на работу и в качестве возможного инструмента для определения того, пытается ли кто-то совершить страховое или кредитное мошенничество. Еще в 2003 году Управлен
Кажется, здесь всё просто....
Кажется, здесь всё просто....

Машинное распознавание эмоций человека обещает стать популярным трендом в IT-индустрии. Эксперты полагают, что индустрия распознавания эмоций станет отраслью с оборотом в 25 миллиардов долларов. Некоторые компании рапортуют об успешном решении этой задачи:

Люди обладают врожденной способностью распознавать и различать лица. Теперь компьютеры могут делать то же самое. Это открывает множество возможностей. Мы также создали конвейер для обнаружения, распознавания и понимания эмоций на любом изображении с помощью всего 8 строк кода после загрузки изображений!

В данных проектах участвуют огромные компании, такие как Microsoft и Apple, а также специализированные стартапы, такие как Kairos и Affectiva. Хотя их наработки чаще всего используются для продаж товаров и услуг, технология распознавания эмоций также используется при найме на работу и в качестве возможного инструмента для определения того, пытается ли кто-то совершить страховое или кредитное мошенничество. Еще в 2003 году Управление транспортной безопасности США начало обучать людей обнаруживать потенциальных террористов, «считывая» их выражения лиц. Так что легко представить себе, что будет разрабатываться алгоритм, способный сделать эту работу.

-2

Но какова будет достоверность такого анализа? Недавние исследования показывают, что эта технология имеет серьезные недостатки. Пять опытных ученых, представляющих разные университеты, просмотрели более тысячи исследований в этой области, пытаясь достичь консенсуса в этом вопросе. Консенсус был достигнут, и он неутешителен для разработчиков подобного программного обеспечения. Как заявляется, нет четкой научной основы для сделанных утверждений:

Компании могут говорить всё, что хотят, но выводы ясны

- говорит Лиза Фельдман Барретт, профессор психологии и один из пяти авторов обзора,

Они могут заметить хмурый взгляд, но это не то же самое, что обнаружить гнев

То есть, по сути, нет надежной связи между выражениями лиц отдельных людей в данный момент времени и их эмоциональным состоянием. Исследователи выявили две проблемы:

1) В большинстве реальных ситуаций дополнительные подсказки помогают нам оценить эмоциональное состояние человека (голос, поведение, контекст ситуации).

2) Большинство психологических тестов соотношения выражения лица и эмоций изначально содержат гипертрофированные примеры, при этом от испытуемых требуют, чтобы они выбрали один вариант в противовес другому (например, гнев или отвращение). В естественной ситуации люди могли бы предпочесть воздержаться такого конкретного суждения. Но если испытуемый вынужден выбирать, то ложный выбор заносится в базу данных для машинного обучения.

Гнев, обида, отвращение или просто усталость?
Гнев, обида, отвращение или просто усталость?

У Барретт даже есть предложения, как лучше распознавать эмоции. Она говорит, что не нужно использовать отдельные фотографии, лучше изучать людей в различных ситуациях в течение определённого периода времени.

Соберите много контекста - например, голос, позу и то, что происходит в окружающей среде, физиологическую информацию, например, что происходит с нервной системой, - и выясните, что означает улыбка для конкретного человека в конкретной ситуации. Повторите и посмотрите, сможете ли вы найти какие-то закономерности в людях с похожими характеристиками, такими как пол и возраст, например.

- говорит она.

Несмотря на то, что Amazon, Google и Microsoft разрабатывают алгоритмы, интуитивно понятные для чувств, психологи предупреждают, что попытки считывать эмоции по мимике в корне ошибочны.

В частности, с машинным обучением мы часто видим, что показатели используются для принятия решений - не потому, что они надежны, а просто потому, что их можно измерить.

Это технология, которая отлично справляется с поиском связей, но это же может привести ко всевозможным ложным выводам. Amazon, например, отказалась подробно рассказать, как клиенты используют распознавание эмоций. Однако, онлайн-документация для Amazon Rekognition предупреждает, что услуга «не является определением внутреннего эмоционального состояния человека и не должна использоваться таким образом».

-4