В то время как индустрия фокусировалась на моделях и агентах ИИ, базовый слой данных, делающий агентный ИИ рабочим — голос — игнорировался. RingCentral ставит голос в центр корпоративного стека ИИ. — techtimes.com
Отрасль была сосредоточена на моделях, агентах и фреймворках автоматизации. Но базовый слой данных, который заставляет агентный ИИ работать, в значительной степени игнорировался.
Компания RingCentral ставит голос в центр корпоративного стека ИИ. В то время как большая часть рынка по-прежнему сосредоточена на больших языковых моделях и цифровых работниках, компания утверждает, что настоящее различие кроется глубже: голос как уровень интеллекта, который превращает агентный ИИ во что-то операционное, масштабируемое и измеримое.
Мощность систем ИИ определяется данными, к которым они могут получить доступ и которые они могут интерпретировать. В большинстве предприятий самый богатый и непрерывный поток бизнес-данных проходит через разговоры: звонки клиентов, обсуждения продаж, обращения в службу поддержки, внутренняя совместная работа. Несмотря на это, голос исторически был изолирован или использовался недостаточно.
Тезис RingCentral прост. Если агентный ИИ собирается перейти от экспериментов к выполнению задач в масштабах предприятия, он должен быть построен на основе разговорного интеллекта. В частности, голоса.
В отличие от статических записей CRM или вручную регистрируемых обновлений, голосовые взаимодействия фиксируют намерения в реальном времени, возражения, настроения, вопросы соответствия требованиям и сигналы о покупке. При структурировании и анализе в масштабе этот разговорный слой становится топливом для автономных систем ИИ, которые могут помогать, рекомендовать и действовать.
RingCentral расширяет свою деятельность за пределы своих корней в технологиях UCaaS и контакт-центров, чтобы позиционировать себя как платформу агентного ИИ, основанную на голосовом интеллекте. В центре этой стратегии находится интегрированная система из трех компонентов, работающих вместе.
AIR, AI Receptionist (ИИ-секретарь), управляет входящими голосовыми взаимодействиями и направляет их. AVA, AI Virtual Assistant (Виртуальный помощник ИИ), поддерживает сотрудников в рабочих процессах. ACE, AI Conversation Expert (Эксперт по разговорам ИИ), анализирует разговоры и извлекает из них информацию. Вместе компания описывает это как «систему опыта», где интеллект генерируется в момент взаимодействия. Недавно компания расширила этот стек с помощью AIR Pro — решения агентного ИИ с приоритетом голоса, предназначенного для разрешения обращений клиентов и завершения транзакций по таким каналам, как голос и обмен сообщениями.
Формулировка имеет значение. Голос становится не просто каналом, а циклом непрерывного обучения, где каждый разговор вносит вклад в корпоративные знания.
На практике это означает, что системы агентного ИИ не работают изолированно. Они информируются контекстом живого разговора.
Менеджер по продажам может получить доступ к предыдущим разговорам с клиентом перед началом переговоров. Агент поддержки на базе ИИ может решать проблемы на основе закономерностей, выявленных в тысячах аналогичных звонков. Команда по соблюдению нормативных требований может автоматически проводить аудит и выявлять риски среди десятков тысяч ежемесячных взаимодействий.
Последний пример использования иллюстрирует масштаб, который это обеспечивает. Согласно примерам производительности, представленным руководством RingCentral, автоматизация на базе ACE позволила масштабировать аудит звонков с нескольких сотен в месяц до более чем 100 000, демонстрируя, как разговорные данные могут быть операционализированы в истинном корпоративном объеме.
Результатом является сдвиг от голоса как реактивного средства к голосу как проактивному интеллектуальному движку.
Поскольку Zoom, Microsoft Teams, Cisco, Dialpad и Salesforce расширяют свои возможности ИИ, дифференциация все больше зависит от того, насколько глубоко ИИ встроен в реальные рабочие процессы в момент разговоров, а не просто наложен сверху в качестве дополнения.
Стратегия RingCentral сосредоточена на владении голосовым уровнем как структурным преимуществом. Структурируя и анализируя разговорные данные по голосу, видео и обмену сообщениями, компания строит архитектуру, в которой агенты ИИ могут помогать сотрудникам в режиме реального времени, автоматизировать транзакции, выявлять операционные инсайты и постоянно совершенствоваться через циклы обратной связи.
Общая рыночная траектория подтверждает эту ставку. К 2030 году большинство организаций по обслуживанию клиентов, как ожидается, будут полагаться на композитные платформы на базе ИИ, а значительная часть корпоративных ролей будет включать работу наряду с агентами ИИ. В таких условиях голос становится связующим звеном между принятием человеческих решений и автономными системами.
Вместо того чтобы позиционировать ИИ как набор дискретных функций продукта, таких как ИИ IVR или ИИ-резюме встреч, RingCentral делает акцент на оркестровке. Цель — не инкрементальная автоматизация, а трансформация предприятия в целом, основанная на разговорном интеллекте.
В этой модели голос одновременно является потоком данных в реальном времени, средством контроля соответствия, механизмом коучинга, триггером транзакций и основой для автономных действий.
По мере созревания агентного ИИ предприятиям потребуется инфраструктура, которая масштабируется безопасно, работает глобально и интегрируется между системами. Аргумент RingCentral заключается в том, что голосовой интеллект, встроенный непосредственно в саму сеть связи, является тем уровнем, который делает все это возможным.
В гонке за определение архитектуры корпоративного ИИ компании, контролирующие слой данных, будут формировать будущее. RingCentral утверждает, что голос — это и есть этот слой, и что агентный ИИ будет настолько же мощным, насколько убедительны разговоры, которые его информируют.
Всегда имейте в виду, что редакции могут придерживаться предвзятых взглядов в освещении новостей.
Автор – Carl Williams