Найти в Дзене
IaaS-платформа 1cloud

Креативный технолог создал своего AI-двойника для Zoom

Вы тоже можете попробовать. У Zoom было отнюдь не простое время. Сначала инструменту для видеоконференцсвязи пришлось столкнуться с огромным наплывом пользователей, затем — с многочисленными сообщениями об уязвимостях уже после того, как с помощью него были проведены миллионы корпоративных и личных онлайн-встреч. Каждой эпохе нужен свой герой. Таким вполне может стать Мэтт Рид, креативный технолог из Redpepper. Он разработал Zoom-бота, который может заменить Рида на видеоконференциях. Все началось с того, что Рид заметил чей-то твит с жалобой автора на отсутствие личного времени из-за многочисленных звонков в Zoom. Что делать, если во время длительной конференции может понадобиться перерыв? Рид начал думать и искать незаурядный вариант решения проблемы. Результатом стал Zoom-бот, которого Рид успел протестировать на своих коллегах. Конечно, в каком-то смысле этот проект разработан исключительно ради шутки. Рид не разработчик по образованию и не претендует на это. Его AI-двойник немного

Вы тоже можете попробовать.

У Zoom было отнюдь не простое время. Сначала инструменту для видеоконференцсвязи пришлось столкнуться с огромным наплывом пользователей, затем — с многочисленными сообщениями об уязвимостях уже после того, как с помощью него были проведены миллионы корпоративных и личных онлайн-встреч.

Каждой эпохе нужен свой герой. Таким вполне может стать Мэтт Рид, креативный технолог из Redpepper. Он разработал Zoom-бота, который может заменить Рида на видеоконференциях.

Все началось с того, что Рид заметил чей-то твит с жалобой автора на отсутствие личного времени из-за многочисленных звонков в Zoom.

Что делать, если во время длительной конференции может понадобиться перерыв? Рид начал думать и искать незаурядный вариант решения проблемы. Результатом стал Zoom-бот, которого Рид успел протестировать на своих коллегах. Конечно, в каком-то смысле этот проект разработан исключительно ради шутки. Рид не разработчик по образованию и не претендует на это. Его AI-двойник немного медленно реагирует, не умеет моргать, говорит роботизированным голосом, как Siri или Alexa.

Чтобы разработать своего двойника, Рид записал себя в Quicktime, где он выглядел странно, растерянно, открывал рот и улыбался. Когда эти образы циклически повторяются, кажется, что у Рида просто плохая связь — и он запрограммировал своего бота сказать так же.

Затем он создал пользовательское веб-приложение, которое использует библиотеку с открытым исходным кодом Artyom.js для прослушивания и ответов на вопросы. Именно она выполняет основную работу, обрабатывая звук из микрофона. Риду пришлось вручную настроить ее на прослушивание определенных фраз, таких как «привет», и запрограммировать свое приложение на запуск собственных команд после распознавания входящих реплик. Например, если двойник услышит «привет», он начнет выполнять соответствующую команду в ответ: программа будет преобразовывать текст в речь, а собеседники услышат реплику двойника.

Принцип работы Zoom-бота похож на то, как работают чат-боты или голосовые ассистенты. Они запрограммированы на понимание определенных входных данных и запуск команд на основе ключевых слов, в результате чего пользователь получает какой-то ответ от робота. Увы, и чат-боты, и Zoom-бот Рида могут ошибаться — всему виной естественная изменчивость языка. При построении реплик необходимо учитывать вариации, ведь даже на «привет» можно ответить по-разному.

Наконец, с помощью инструмента ManyCam Рид создал виртуальную веб-камеру, используя свое веб-приложение в качестве источника сигнала. По словам Рида, он успешно запустил свой полный прототип всего за одно утро.

Об этой истории узнали и другие пользователи, а разработчики, которым понравилась идея Рида, внесли некоторые улучшения в его код с GitHub. Хотите попробовать создать своего двойника?

Понравилась статья? Тогда ставьте лайк и подписывайтесь на канал, чтобы не пропускать новые выпуски!