128 подписчиков
В ответ на пост
Добавлю контекста по посту выше
Мне в личку уважаемые люди написали, что контекст кейса лишним не было бы описать.
Суть интеграции следующая — происходит запись разговора (разумеется все участники об этом уведомлены). После этого запись передается в salute-speech (сберовский транскрибатор). Оттуда приходит текст и на этом этапе все проходит ок.
Дальше этот транскрибированный текст передается уже гигачат с просьбой сделать саммари и выделить важные факты из разговора. И на этом этапе тоже все работает прекрасно! Кроме историй со стоп словами. Причем если туда передать текст с матерными высказываниями, то все отрабатывает спокойно.
А если во время разговора кто-то просто скажет "я планирую на неделю уехать в крым на эти даты, поэтому задачу сделать не смогу", то на этом вся система построения саммари дает ответ "простите, но на эту тему говорить не могу". И это прям напрягает.
В связи с этим вопрос — насколько вообще корректно LLM через API использовать для подобной задачи? Может быть мы пытаемся микроскопом гвозди забивать и LLM для этого вообще малопригодна?
Около минуты
10 октября 2024