» Со стороны кажется, что расшифровка встреч давно решена: загрузил запись совещания — получил текст. Но в корпоративной среде всё работает иначе. Конфиденциальные данные нельзя отправлять в публичные сервисы, встречи проходят в шумных переговорках, участники говорят одновременно, используют внутренние термины и сокращения, а итоговый результат должен подходить для протоколов, отчётов и дальнейшей работы. В Таймлист мы прошли этот путь на практике и быстро поняли: качественная транскрибация — это не одна «умная модель», а целая инженерная система. С какими сложностями мы столкнулись в реальных проектах: 💙 Безопасность и инфраструктура. Во многих компаниях решения должны работать внутри корпоративного контура, без передачи данных наружу, и при этом укладываться в ограничения по ресурсам. 💙 Качество аудио. Офисные шумы, эхо, несколько микрофонов, гибридные встречи — всё это сильно снижает точность без дополнительной обработки звука. 💙 Корпоративная лексика. Названия проектов, проду
💙 Почему корпоративная транскрибация — это сложная инженерная задача, а «не прикрутить Whisper
19 декабря19 дек
1 мин