Облачный сервис Yandex Cloud для глубокой аналитики звонков и чатов: распознавание речи, смысловые теги, отчёты, API и ассистенты на YandexGPT.
Что это
Yandex SpeechSense — облачный сервис Yandex Cloud для глубокой аналитики голосовых и текстовых коммуникаций. Построен на стеке SpeechKit (распознавание и синтез речи), YandexGPT Pro (смысловой анализ) и Yandex Translate. Основная задача — превратить сырые записи звонков и чаты поддержки в структурированные данные: оценки качества, тематические срезы, отчёты для руководителей.
Официальная страница: cloud.yandex.ru/services/speechsense
Основные возможности
Возможность Как работает Распознавание речи Автоматическая транскрибация аудио через SpeechKit — двухканальные записи с разделением оператора и клиента Смысловые теги Конструктор тегов на основе YandexGPT — определяет темы, намерения, жалобы и ключевые события в диалоге Словарные теги Поиск по ключевым словам и фразам — точное срабатывание на конкретные формулировки Поиск по диалогам Полнотекстовый и смысловой поиск — находит диалоги по контексту, а не только по точным словам Отчёты и дашборды Визуальные отчёты по тегам, операторам, периодам — без выгрузки в Excel Анализ чатов Работает не только с аудио, но и с текстовыми диалогами из мессенджеров и онлайн-чатов ИИ-ассистенты Настраиваемые агенты на YandexGPT Pro, Lite, Qwen3 235B или DeepSeek V3.2 — автоматическое резюме диалога, оценка качества, извлечение фактов Офлайн-аналитика Аудиобейджи (Badges) — загрузка аудио с носимых устройств для анализа офлайн-встреч API gRPC и REST API для загрузки диалогов, управления проектами и выгрузки результатов
Чем отличается от обычной речевой аналитики
SpeechSense Классические решения Анализ смысла YandexGPT понимает контекст и намерение Поиск по ключевым словам Каналы Голос + текст в одном интерфейсе Обычно только голос Настройка Конструктор тегов без кода Правила пишут разработчики Модели Выбор из YandexGPT Pro/Lite, Qwen3, DeepSeek Фиксированная модель Размещение Облако Yandex Cloud или on-premises Чаще только облако
Интеграция и подключение
Начало работы
- Создайте пространство (Space) и проект внутри него
- Настройте подключение — аудио или текст
- Загрузите диалоги через интерфейс или API
Авторизация API
SpeechSense использует стандартную авторизацию Yandex Cloud:
- IAM-токен — для запросов от имени пользователя
- API-ключ — для сервисных аккаунтов (рекомендуется для автоматизации)
Все запросы идут через gRPC или REST. Документация: cloud.yandex.ru/docs/speechsense
Форматы данных
- Аудио: WAV, OggOpus — двухканальные файлы (отдельные дорожки оператора и клиента). Одноканальные конвертируются автоматически
- Текст: JSON с массивом сообщений — каждое сообщение содержит автора, текст и таймстемп
On-premises
Для компаний с жёсткими требованиями к хранению данных доступна установка на собственной инфраструктуре. Развёртывание — через менеджера Yandex Cloud.
Тарифы и лимиты
Аудиодиалоги
Тарификация — за минуту двухканального аудио. Цена складывается из распознавания и аналитики.
Минут в месяц Распознавание Аналитика Итого за минуту до 100 000 0,61 ₽ 1,40 ₽ 2,00 ₽ 100 001 – 500 000 0,37 ₽ 1,03 ₽ 1,40 ₽ 500 001 – 1 000 000 0,30 ₽ 0,61 ₽ 0,91 ₽ 1 000 001 – 2 500 000 0,30 ₽ 0,43 ₽ 0,73 ₽ от 2 500 001 0,30 ₽ 0,30 ₽ 0,61 ₽
Текстовые диалоги
Тарификация — за 1 000 символов.
Тысяч символов в месяц Цена за 1 000 символов до 100 000 1,40 ₽ 100 001 – 500 000 1,04 ₽ 500 001 – 1 000 000 0,61 ₽ 1 000 001 – 2 500 000 0,43 ₽ от 2 500 001 0,31 ₽
ИИ-ассистенты (дополнительно)
Модель Цена за 1 000 символов YandexGPT Lite 0,025 ₽ YandexGPT Pro 0,15 ₽ Qwen3 235B 0,31 ₽ DeepSeek V3.2 0,31 ₽
Автоматический пересчёт словарных и смысловых тегов — бесплатно. Цены указаны с НДС, актуальны на май 2026.
Квоты
- До 100 проектов на одно пространство
- До 1 000 тегов на проект
Практические сценарии
Контроль качества в контакт-центре
Самый прямой сценарий. SpeechSense автоматически проверяет, следует ли оператор скрипту, использует ли обязательные фразы, не грубит ли. Руководитель видит дашборд, а не слушает записи вручную.
Выявление повторяющихся проблем
Смысловые теги группируют диалоги по темам: «задержка доставки», «ошибка в счёте», «возврат товара». Вместо точечных жалоб — системная картина: какие проблемы растут, какие уходят.
Обучение новых операторов
Поиск по диалогам позволяет собрать библиотеку эталонных и провальных разговоров. Новичок слушает лучшие примеры, а не учится на собственных ошибках.
Аналитика продаж
Теги фиксируют, где клиент проявил интерес, где оператор предложил допродажу, где сделка сорвалась. Отдел продаж получает данные для точечных улучшений скриптов.
Анализ офлайн-встреч
Аудиобейджи записывают переговоры, консультации, приёмы — и загружают в SpeechSense для анализа. Полезно в банках, клиниках, автосалонах.
Мультиканальная поддержка
Один интерфейс для звонков и чатов. Можно сравнивать качество обслуживания по каналам и находить узкие места.
Ссылки
- Бесплатный курс по SpeechSense (AI Studio Яндекса)
- Сертификация и безопасность — ISO 27001, PCI DSS, 152-ФЗ
По теме
SpeechSense — пример того, как облачный ИИ-стек превращает неструктурированные данные (звонки, чаты) в управленческие решения. Если вас интересует тема практического внедрения ИИ — вот ещё три материала.
Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov