136 подписчиков

Как проверить голосовое сообщение: это реальный человек или нейросеть?

24 декабря 202524 дек 2025

180

2 мин

«Мам, скинь 5000 на карту, срочно». Раньше такие сообщения приходили текстом, и мы знали: это мошенники. Теперь они приходят голосом. Голосом вашего сына, начальника или клиента. Голосовые сообщения (войсы) стали частью деловой переписки. В судах они всё чаще фигурируют как доказательства договоренностей или угроз. Но в 2025 году верить ушам стало опасно. Нейросети научились клонировать голос за секунды. Как понять, что с вами говорит бот, а не живой человек? Вот 4 признака, которые можно услышать даже без спецоборудования. Самый простой и надежный способ.

Когда человек говорит, он дышит. Мы делаем вдохи перед длинными фразами, выдыхаем в конце, иногда причмокиваем или сглатываем слюну. Это «биологический шум». Попробуйте сказать фразу: «Я очень зол на тебя!» с каменным лицом. Трудно, правда? Голос меняется вместе с эмоцией. Когда мы кричим, голос срывается. Когда шепчем — меняется тембр. Нейросети иногда «глотают» окончания или, наоборот, растягивают их неестественно долго. Русский я

Оглавление

Как проверить голосовое сообщение: это реальный человек или нейросеть?
1. Тест на дыхание
2. Эмоциональная «плоскость»

Как проверить голосовое сообщение: это реальный человек или нейросеть?

«Мам, скинь 5000 на карту, срочно».

Раньше такие сообщения приходили текстом, и мы знали: это мошенники. Теперь они приходят голосом. Голосом вашего сына, начальника или клиента.

Голосовые сообщения (войсы) стали частью деловой переписки. В судах они всё чаще фигурируют как доказательства договоренностей или угроз. Но в 2025 году верить ушам стало опасно. Нейросети научились клонировать голос за секунды.

Как понять, что с вами говорит бот, а не живой человек? Вот 4 признака, которые можно услышать даже без спецоборудования.

1. Тест на дыхание

Самый простой и надежный способ.
Когда человек говорит, он дышит. Мы делаем вдохи перед длинными фразами, выдыхаем в конце, иногда причмокиваем или сглатываем слюну. Это «биологический шум».

Признак фейка: Голос говорит длинными, сложными предложениями без единой паузы на вдох. Или паузы есть, но в них стоит абсолютная, «мертвая» тишина. Нейросеть не дышит — она просто генерирует звук.

2. Эмоциональная «плоскость»

Попробуйте сказать фразу: «Я очень зол на тебя!» с каменным лицом. Трудно, правда? Голос меняется вместе с эмоцией. Когда мы кричим, голос срывается. Когда шепчем — меняется тембр.

Признак фейка: Голос звучит ровно и монотонно, даже если произносит эмоциональные слова («Срочно!», «Кошмар!»). Интонация не соответствует смыслу слов. Например, фраза «Я сейчас вызову полицию» звучит так же спокойно, как «Я сейчас выпью чаю».

3. Артефакты на концах слов

Нейросети иногда «глотают» окончания или, наоборот, растягивают их неестественно долго.

Признак фейка: Прислушайтесь к шипящим звукам («с», «ш», «щ») и концам предложений. В сгенерированном аудио они могут звучать с легким металлическим призвуком («роботизированный эффект») или обрываться слишком резко, будто звук выключили рубильником.

4. Странности с ударениями

Русский язык сложен для алгоритмов из-за подвижного ударения.

Признак фейка: Голос делает ударения не там, где привык делать этот конкретный человек. Или использует интонацию вопроса там, где должно быть утверждение. Если ваш знакомый всю жизнь говорил «звОнит», а в сообщении вдруг сказал литературное «звонИт» (или наоборот) — это повод насторожиться.

Лайфхак: Как проверить собеседника прямо сейчас?

Если вы сомневаетесь, кто прислал вам войс, попросите его сделать что-то нестандартное.
Напишите: «Слушай, связь плохая. Скажи голосом: „Тридцать три корабля лавировали“».

Нейросеть сможет это озвучить. Но скороговорки требуют сложной артикуляции и дыхания, на которых алгоритм с большой вероятностью проколется и выдаст тот самый «металлический» звук.

А если это доказательство в суде?

В суде вы не можете попросить запись «сказать скороговорку». Вам приносят уже готовый файл. И если мошенники использовали качественную платную нейросеть, она будет и «дышать», и делать паузы. Ухом вы не отличите подделку.

Здесь нужна спектрограмма.

Мы создаем сервис, который анализирует аудио на уровне звуковых волн. Он видит микроразрывы в частотах, которые оставляет нейросеть при генерации. Это мгновенная проверка, которая точно скажет: говорил человек или алгоритм.

Наш сайт пока в разработке, но вы можете получить доступ к инструменту, который защитит вас от аудио-обмана.

Оставьте ваши контакты в форме заявки на предзапись, чтобы получить бесплатный доступ к тестированию сервиса и всегда знать, чей голос звучит в динамике.