Ссылка на первоисточник статьи
Стартап по распознаванию речи Deepgram получил нераскрытую стратегическую инвестицию от In-Q-Tel (IQT), венчурного подразделения разведывательного сообщества США. In-Q-Tel и его правительственные партнеры теперь начнут тестировать технологию распознавания речи и транскрипции Deepgram.
Умная речь
Платформа автоматической транскрипции и анализа речи Deepgram построена с акцентом на корпоративные сервисы. Предприятия могут использовать ИИ для сбора и организации телефонных звонков или встреч, как и другие услуги транскрипции. То, что определяет подход пятилетнего стартапа к распознаванию речи, использование сквозного глубокого обучения, а не эвристику. Deepgram утверждает, что его технология бьет своих конкурентов, когда дело доходит до точности. Эта точность делает распознавание речи и транскрипцию более ценными практически в любом контексте предприятия. Федеральное правительство не является исключением, но инвестиции не произошли в одночасье.
” Это интересная история знакомств", - сказал генеральный директор Deepgram Скотт Стивенсон в интервью Voicebot. “Мы знаем людей там уже давно и знаем их инвестиционную стратегию вокруг голосовых технологий. Тогда это не имело смысла для такой договоренности, но теперь все изменилось. Преимущество стратегических инвестиций заключается в уменьшении препятствий для работы с федеральным правительством, чтобы мы могли обеспечить доступ к Deepgram.”
Deepgram — это не первое погружение In-Q-Tel в инвестиции в речевые технологии. В 2005 году компания VC инвестировала в CallMiner и его программное обеспечение для анализа речи телефонных звонков,а затем в 2009 году была заключена сделка по инвестированию в стартап распознавания речи Carnegie Speech. В истории портфеля In-Q-Tel отмечается большое количество инвестиций в соответствующие технологии, такие как распознавание почерка и программное обеспечение мгновенного перевода. Широта технологий In-Q-Tel крайне интересна, учитывая ее корни в ЦРУ и тот факт, что Q в названии относится к вечно изобретательному поставщику высокотехнологичных инструментов для Джеймса Бонда. Сделка с Deepgram не означает, что секретные агенты будут использовать технологию стартапа для расшифровки разговоров между шпионами: по крайней мере, пока нет. Изначально, технология пройдет некоторые тесты, чтобы увидеть, как она может вписаться в правительственные интересы.
“На данном этапе речь идет скорее о проверке технологий”, - сказал Стивенсон. "Но, желание проверить это, означает, что это будет довольно глубокая интеграция. Это не просто поверхностный тест. Один из ключевых тезисов In-Q-Tel заключается не в том, чтобы превратить компанию в то, что нужно правительству, а вместо этого спросить: что вы разрабатывайте, чтобы правительство могло это использовать? В прошлом распознавание речи было очень жестким. То, что Deepgram может адаптироваться к разным моделям, является ключевой особенностью для них.”
Deepgram копает внутри
Новое соглашение о финансировании с In-Q-Tel продолжает очень напряженный год для Deepgram. В марте стартап привлек $12 млн. раунд финансирования Series A во главе с Wing VC вместе с NVIDIA, Y Combinator и другими инвесторами. Общая сумма инвестиций Deepgram составила $ 13,9 млн. Затем, когда кризис здравоохранения COVID-19 обострился в апреле, компания пожертвовала $ 1 млн своей платформы для оказания помощи медицинским поставщикам (до $50 000 технологий каждый в зависимости от их размера и потребности).
“С тех пор у нас было хорошее понимание медицинских услуг”, - сказал Стивенсон. “Технология распознавания речи и транскрипции ценна не только во время пандемии, но и в долгосрочной перспективе”.
Автоматизация медицинской транскрипции и анализа стала более популярной в отрасли еще до пандемии. Медицинские провайдеры могут попробовать Amazon Transcribe Medical или платформу, которая настроил Microsoft, чтобы улучшить виртуальный помощник Nuance Dragon Medical. Deepgram также не ограничил свою платформу одной отраслью в своих усовершенствованиях. В рамках предыдущего инвестиционного объявления стартап показал, что он добавил потоковую передачу в режиме реального времени в качестве опции, позволяющей ИИ транскрибировать и анализировать разговоры по мере их возникновения. Компания также добавила параметр локального развертывания. Это то же самое, что и стандартное программное обеспечение, за исключением того, что вся обработка происходит на серверах клиента, без отправки каких-либо данных в облако.
"Использование Deepgram с поддержкой искусственного интеллекта, нейросетевой архитектуры, и использующей пользовательские модели распознавания речи, обученные на огромных объемах аудиоданных, позволяет быстро достичь гораздо более точных транскрипций для нестандартных аудиосред против решений, таких как Google Voice и Apple Siri”,-сказал в своем заявлении управляющий партнер In-Q-Tel Джордж Хойем. "Использование современного обучения по передаче данных также позволяет Deepgram быстро создавать возможности преобразования речи в текст для новых и новых языковых вариантов на относительно небольших объемах обучающих данных, что приводит к огромной экономии времени для наших правительственных партнеров.”
Статья подготовлена аналитическим контакт-центром Skewes
Оценив статью лайком, вы поможете другим пользователям больше узнавать о новинках и разработках голосового ИИ.