Добавить в корзинуПозвонить
Найти в Дзене
Новости СНГ

Чистый звук из Еревана: армянские технологии покоряют мир

Когда-то шум мешал работать, теперь он стал причиной технологического прорыва. Армянский стартап Krisp превратил идею «научить компьютер не слышать лишнее» в глобальную технологию, которой пользуются миллионы людей по всему миру. Это история о личном опыте, научной смелости и неожиданном успехе, изменившем культуру цифрового общения, сообщает международное издание «Erevan.One». Давид Багдасарян, будущий основатель Krisp, работал в американской компании Twilio, но часто бывал в Армении. Из‑за разницы во времени ему приходилось подключаться к совещаниям поздно вечером — в кафе, у друзей, в шумных местах. Детский плач, уличный гул, разговоры вокруг превращали каждую встречу в испытание. Будущий основатель компании задумался, можно ли сделать так, чтобы компьютер понимал, где человеческий голос, а где — шум, и избавлялся от лишнего? Эту мысль Багдасарян обсудил с другом Артаваздом Минасяном, которому требовалась амбициозная исследовательская задача. К ним присоединился Степан Саргсян, позж
Оглавление

Когда-то шум мешал работать, теперь он стал причиной технологического прорыва. Армянский стартап Krisp превратил идею «научить компьютер не слышать лишнее» в глобальную технологию, которой пользуются миллионы людей по всему миру. Это история о личном опыте, научной смелости и неожиданном успехе, изменившем культуру цифрового общения, сообщает международное издание «Erevan.One».

От шумного кафе до искусственного интеллекта

Давид Багдасарян, будущий основатель Krisp, работал в американской компании Twilio, но часто бывал в Армении. Из‑за разницы во времени ему приходилось подключаться к совещаниям поздно вечером — в кафе, у друзей, в шумных местах. Детский плач, уличный гул, разговоры вокруг превращали каждую встречу в испытание.

Будущий основатель компании задумался, можно ли сделать так, чтобы компьютер понимал, где человеческий голос, а где — шум, и избавлялся от лишнего? Эту мысль Багдасарян обсудил с другом Артаваздом Минасяном, которому требовалась амбициозная исследовательская задача. К ним присоединился Степан Саргсян, позже ставший главным научным сотрудником проекта.

Несмотря на отсутствие опыта в машинном обучении и цифровой обработке сигналов, команда за полгода создала работающий прототип нейросети, способной в реальном времени отделять речь от фоновых звуков. Для обучения разработчики собрали два масштабных набора данных: один с тысячами записей шумов — от автосигнализаций до шелеста бумаги, и другой — с чистыми образцами речи. Нейросеть «училась» отличать голос от помех, накладывая одни записи на другие с разной интенсивностью.

Мировая известность — случайно

В 2017 году Багдасарян покинул Twilio и вместе с партнерами основал компанию 2Hz, вскоре переименованную в Krisp. Осенью 2018 года продукт был готов, и Давид опубликовал статью о технологии в блоге Nvidia. Эффект оказался неожиданным: ссылку быстро подхватили сообщества Hacker News и Product Hunt. За несколько дней о стартапе узнали по всему миру.

Krisp мгновенно стал хитом: приложение заняло первые позиции как «продукт дня», «недели» и даже «года». Парадоксально, но команда не имела ни маркетинговой стратегии, ни планов по продвижению, а сам основатель сначала даже пытался убрать публикацию. Однако неожиданная волна интереса превратила Krisp в символ новой эры чистого звука.

Стандарт онлайн-коммуникаций

Сегодня Krisp производит программное обеспечение на базе искусственного интеллекта, которое устраняет фоновый шум и эхо как со стороны микрофона, так и динамиков. Оно работает мгновенно, без искажения голоса и задержек, совместимо с Windows и macOS и легко интегрируется с Zoom, Skype, Slack и другими сервисами видеосвязи.

Приложение не требует специального оборудования и обрабатывает звук локально, сохраняя конфиденциальность данных. Благодаря экономному потреблению ресурсов Krisp стабильно работает даже на старых компьютерах. Пользователи могут выбрать бесплатный тариф с лимитом минут или платную версию с неограниченным использованием.

От чистого звука к новой речи

Сооснователь компании Артавазд Минасян признается, что идея следующего продукта родилась из личного опыта.

  Артавазд Минасян, соучредитель и президент Krisp. Источник: сайт newsroom.aua.am.
Артавазд Минасян, соучредитель и президент Krisp. Источник: сайт newsroom.aua.am.
«Как человек с акцентом, я часто замечал, что людям трудно понять меня, даже когда я свободно владею английским. Дело не в предвзятости — это просто реальность общения. На быстро меняющихся совещаниях даже небольшие недоразумения могут замедлить принятие решений, вызвать повторения и снизить общую эффективность», - говорил Минасян.

Так появился AI Accent Conversion — инструмент, преобразующий акцент говорящего в американский английский в режиме реального времени. Программа работает как виртуальный микрофон, подходит для Zoom, Google Meet, Microsoft Teams и Webex. Задержка составляет около 200 миллисекунд, а голос остается естественным — лишь немного «роботизированным».

Пока технология поддерживает свыше семнадцати индийских диалектов и доступна в бета-версии. Krisp планирует добавить другие разновидности английского, включая филиппинский акцент. Несмотря на этические споры вокруг «изменения голоса», компания подчеркивает, что цель инструмента — улучшить взаимопонимание, а не стандартизировать речь.