156 подписчиков

В ответ на пост

Добавлю контекста по посту выше

Мне в личку уважаемые люди написали, что контекст кейса лишним не было бы описать.

Суть интеграции следующая — происходит запись разговора (разумеется все участники об этом уведомлены). После этого запись передается в salute-speech (сберовский транскрибатор). Оттуда приходит текст и на этом этапе все проходит ок.

Дальше этот транскрибированный текст передается уже гигачат с просьбой сделать саммари и выделить важные факты из разговора. И на этом этапе тоже все работает прекрасно! Кроме историй со стоп словами. Причем если туда передать текст с матерными высказываниями, то все отрабатывает спокойно.

А если во время разговора кто-то просто скажет "я планирую на неделю уехать в крым на эти даты, поэтому задачу сделать не смогу", то на этом вся система построения саммари дает ответ "простите, но на эту тему говорить не могу". И это прям напрягает.

В связи с этим вопрос — насколько вообще корректно LLM через API использовать для подобной задачи? Может быть мы пытаемся микроскопом гвозди забивать и LLM для этого вообще малопригодна?

Около минуты

10 октября 2024