Знаете анекдот про среднюю температуру в больнице?
В среднем она 36,6 просто у кого-то жар, а кто-то окоченел...
ИИ пока делает примерно тоже самое:
Пока ты на созвоне думаешь что незаметно скучаешь — нейросеть уже всё про тебя поняла. Рынок программ которые распознают эмоции по лицу подобрался к 38 миллиардам долларов за год. Учёные научили алгоритм считывать эмоции и вовлечённость прямо во время видеозвонков — чтобы встроить это в Zoom и онлайн-школы. Теперь машина в реальном времени докладывает заинтересован собеседник или мысленно уже ушёл пить чай.
Звучит как далёкое будущее. На самом деле касается каждого кто хоть раз сидел на совещании с каменным лицом и надеялся что никто не заметил.
И вот тут начинается интересное.
Камера ловит что уголки губ опустились — и вешает ярлык "грусть". А грусть ли это? Человек мог просто вспомнить про невыключенный утюг.
Машина видит мышцу. Я вижу человека целиком — как он держался минуту назад, что у него за история, совпадает ли лицо со словами, с позой, с паузами между фразами.
Эмоция без контекста это просто набор пикселей. Один и тот же поджатый рот у одного значит злость. У другого — детскую привычку сдерживаться. У третьего — просто сухие губы и больше ничего. Алгоритм усредняет миллионы чужих лиц и выдаёт табличку. А людей читают не по среднему — по тому чем человек отличается от себя вчерашнего.
Вот и вся разница между человеком и нейросетью.
Машина прекрасно замечает что происходит на лице. Почему оно там происходит — понимает только тот кто смотрит на человека, а не на ярлык с эмоцией.
Базовое поведение конкретного человека. История которая привела к этому моменту. Совпадение или расхождение между словами и телом. Это всё то о чём я пишу здесь — и то чего табличка с процентами никогда не покажет.
Поэтому я спокойна за тех кто умеет видеть людей вживую. Лупа пока выигрывает у алгоритма.
А вас уже пробовали "читать" по лицу — приложением или просто человеком который слишком внимательно смотрел? Попадали в точку или пальцем в небо?
Шерли Котс