Нередко заказчики экспертиз ставят перед нами задачу, связанную не с верификацией личности участника телефонного разговора (ответ на вопрос: принадлежит ли голос на такой-то фонограмме лицу Х, образцы устной речи которого представлены?), а с установлением тождества голосов и речи неизвестных дикторов (ответ на вопрос: принадлежат ли голоса неизвестных дикторов на нескольких фонограммах одному или разным лицам?). Иногда, «неизвестный диктор» говорит на нескольких языках. Например, в одной из последних экспертиз неизвестный диктор говорил на трех языках, являясь, возможно, носителем четвертого.
В подобных случаях (много фонограмм, разные языки), когда использование только традиционного спектрально-формантного метода является нецелесообразным ввиду больших временных затрат, неоценимую помощь может оказать модуль автоматической идентификации из состава SIS II (разработка «Центра речевых технологий»). В модуле используется три метода выделения и сравнения идентификационно значимых признаков голоса и речи: статистик основного тона (EER=16…20%); спектрально-формантный (EER=6…7%) и метод полной изменчивости (EER=12…13%)*.
Так, в упомянутой выше экспертизе подготовка заключения по результатам идентификации (7 попарных с применением модуля SISII заняла, без учета временных затрат на сегментацию фонограмм (в настоящее время СОРМ способен самостоятельно разделять речь участников разговора по каналам) и оценку их пригодности, около 4 часов. Модуль SISII – со степенью уверенности от средней до высокой – в течение считанных секунд выдал обобщенное решение о тождестве неизвестных дикторов, основанное на использовании алгоритмов взвешенного голосования (формула включает количество методов идентификации, весовой коэффициент каждого метода и ошибки первого и второго рода).
По результатам такого исследования эксперт в зависимости от полученного LR (отношение ошибок первого и второго рода) для каждого сравнения, может сделать вывод о тождестве голосов или принять решение о необходимости использования «ручных» методов исследования.
*Значение зависит от качества (отношение сигнал/шум, частотный диапазон, искажения, обусловленные неравномерностью АЧХ канала записи), продолжительности и сопоставимости характеристик сигналов.