30 подписчиков

Автоматическая идентификация в фоноскопической экспертизе. Опыт использования.

2 июля 20192 июл 2019

1 мин

Нередко заказчики экспертиз ставят перед нами задачу, связанную не с верификацией личности участника телефонного разговора (ответ на вопрос: принадлежит ли голос на такой-то фонограмме лицу Х, образцы устной речи которого представлены?), а с установлением тождества голосов и речи неизвестных дикторов (ответ на вопрос: принадлежат ли голоса неизвестных дикторов на нескольких фонограммах одному или разным лицам?). Иногда, «неизвестный диктор» говорит на нескольких языках. Например, в одной из последних экспертиз неизвестный диктор говорил на трех языках, являясь, возможно, носителем четвертого. В подобных случаях (много фонограмм, разные языки), когда использование только традиционного спектрально-формантного метода является нецелесообразным ввиду больших временных затрат, неоценимую помощь может оказать модуль автоматической идентификации из состава SIS II (разработка «Центра речевых технологий»). В модуле используется три метода выделения и сравнения идентификационно значимых признаков

В подобных случаях (много фонограмм, разные языки), когда использование только традиционного спектрально-формантного метода является нецелесообразным ввиду больших временных затрат, неоценимую помощь может оказать модуль автоматической идентификации из состава SIS II (разработка «Центра речевых технологий»). В модуле используется три метода выделения и сравнения идентификационно значимых признаков голоса и речи: статистик основного тона (EER=16…20%); спектрально-формантный (EER=6…7%) и метод полной изменчивости (EER=12…13%)*.

Так, в упомянутой выше экспертизе подготовка заключения по результатам идентификации (7 попарных с применением модуля SISII заняла, без учета временных затрат на сегментацию фонограмм (в настоящее время СОРМ способен самостоятельно разделять речь участников разговора по каналам) и оценку их пригодности, около 4 часов. Модуль SISII – со степенью уверенности от средней до высокой – в течение считанных секунд выдал обобщенное решение о тождестве неизвестных дикторов, основанное на использовании алгоритмов взвешенного голосования (формула включает количество методов идентификации, весовой коэффициент каждого метода и ошибки первого и второго рода).

По результатам такого исследования эксперт в зависимости от полученного LR (отношение ошибок первого и второго рода) для каждого сравнения, может сделать вывод о тождестве голосов или принять решение о необходимости использования «ручных» методов исследования.

*Значение зависит от качества (отношение сигнал/шум, частотный диапазон, искажения, обусловленные неравномерностью АЧХ канала записи), продолжительности и сопоставимости характеристик сигналов.