Новая разработка американского IT-гиганта Google выглядит как технология двойного назначения. С одной стороны это находка для шпиона, который сможет выявить и подслушать говорящего на расстоянии, даже если тот прячется в толпе людей. С другой – прорыв в анализе голосовых данных поможет многочисленным инвалидам по слуху и повысит эффективность сервисов самой Google. Так как это работает? Распознать голос человека, даже при наличии помех, несложно – проблема в том, чтобы идентифицировать его обладателя. Разработчики Google просто приставили к микрофону видеокамеру с алгоритмом, который реагирует на мимику человека. Система сопоставляет движения на лице говорящего, «читает по губам» и параллельно анализирует звук. Если результаты совпадают – отлично, ИИ вычленяет этого персонажа и может следить только за его речью на фоне общей какофонии звуков. Нейронную сеть сначала обучили самой технике чтения по губам, затем научили отличать людей говорящих от просто смеющихся, распознавать мимику пр
Искусственный интеллект Google научился распознавать отдельные голоса в толпе
15 апреля 201815 апр 2018
1
1 мин