Всем привет! Меня зовут Сергей и я продакт в крупной российской IT-компании. Это мой первый опыт написания статьи для Дзен, я очень волнуюсь, но надеюсь, что мой пост будет полезен широкому кругу специалистов, и, кстати, не только из сферы управления продуктами.
Боль продакта: когда встречи становятся твоей жизнью
В работе мне часто приходится иметь дело с огромным количеством онлайн встреч, звонков, интервью, конференций. В среднем так я провожу около 20 часов в неделю. Часть таких звонков являются важным атрибутом продакт-менеджера: синки с командой, встречи со стейкхолдерами, CustDev-интервью, обсуждения с дизайнерами и разработчиками...Список можно продолжать бесконечно.
После каждой подобной встречи (мы их часто записываем) мне приходилось:
- прослушивать записи повторно;
- делать заметки вручную (на встрече часто не успеваешь это делать из-за большого потока информации от коллег);
- выписывать ключевые решения;
- формулировать задачи;
- составлять списки того, что нужно не забыть.
Все эти процессы занимают практически все рабочее время, а работать-то когда? За свободные пару часов в день нужно успеть выполнить множество других задач, которые иногда неделями хранятся в бэклоге.
В поисках спасения
И тут на помощь мне пришел искусственный интеллект. В Интернете множество сервисов, которые позволяют транскрибировать аудио и видео в текст. Есть уже как встроенные траскнрибаторы (в том же Яндекс Телемост или Telegram), есть сторонние сервисы - как бесплатные, которые не отличаются качеством и удобством использования, так и платные, однако часто их функционал ограничен, или они чересчур дорогие.
Мой рабочий инструмент - Telegram, в котором сосредоточена вся моя рабочая и нерабочая жизнь. По этой причине я искал решение, которое позволит мне, не выходя за пределы мессенджера, закрывать большинство задач, связанных с расшифровкой аудио или видео.
Сервисов, которые предлагают услуги по транскрибации внутри Telegram также оказалось довольно много - опять же как бесплатных (ограниченный фунционал в виде нескольких доступных расшифровок в месяц), так и платных (с дополнительными функциями по расшифровке).
Я попробовал около 10 Telegram-ботов (Memo AI, Буквица, WhisperBot, mymeet и другие). В каждом из них я провел достаточное количество времени, чтобы оценить как они справляются с различными файлами (аудио, видео, голосовые сообщения, записи с плохим качеством), а также какой дополнительный функционал они предлагают.
Memo AI - бот, который изменил все
Как я писал выше, мне удалось в разных режимах протестировать большое количество сервисов (в основном, ботов) внутри Telegram.
На мой взгляд, Memo AI - оказался наиболее удачным среди них. В данном Telegram-боте реализована не только возможность расшифровывать аудио или видео в текст, но и возможность получить персонализированный AI-отчет, который сильно ускоряет и упрощает мои рабочие процессы:
- Загружаю файл в бот;
- Через несколько минут получаю расшифровку высокого качества в удобном мне формате (для меня - это PDF, но есть еще Word/TXT);
- В расшифровке уже сразу автоматически сделано краткое содержание, разделение на спикеров (их можно самостоятельно переименовать прямо внутри бота) и тайм-коды;
- Далее формирую нужный мне AI-отчет (например, по анализу дейли).
Про деньги
Конечно за такой удобный инструмент нужно платить рублем, но опять же разработчиков Memo AI можно похвалить за отсутствие жадности. Они предлагают на выбор различные варианты как пакетов минут, так и подписок, чтобы пользователи могли подобрать тариф под свои собственные нужды и не переплачивали зря. Более того, на старте дают бесплатные минуты, чтобы протестировать сервис.
Цифры не врут
За время, что я пользуюсь Memo AI, мне удалось выяснить, что простые несколько этапов транскрибации, описанные выше, экономят мне до 5 часов чистого времени в неделю или 20 часов в месяц, или 240 часов в год, которые я могу потратить на реализацию своих многочисленных идей по развитию продукта, которым я управляю.
Вывод
Технологии искусственного интеллекта для обработки речи уже достигли уровня, когда они действительно могут существенно упростить жизнь и работу. Особенно приятно, что технологии дошли и до такого уровня, что подобные задачи по транскрибации можно решать внутри Telegram, который, как говорил выше, я на ежедневной основе использую как для работы, так и для личных целей.
Мной был проделан сложный и тернистый путь в поисках инструмента, который станет для меня незаменимым помощником в экономии десятков часов моего рабочего времени. Я рад, что поиски прошли не зря, и такой сервис был найден. Если ваша работа так же, как и моя, связана с большим количеством аудио или видео файлов, встреч, лекций и вебинаров, я рекомендую вам попробовать Memo AI. Даже в рамках бесплатных минут можно оценить все преимущества сервиса.
А как вы решаете проблему транскрибации встреч? Делитесь своим опытом в комментариях!