Почему одного запроса к нейросети недостаточно для качественного текста

12 марта12 мар

1 мин

Большинство AI-сервисов для работы с текстом устроены одинаково: вы отправляете запрос нейросети, она выдаёт результат. Для простых задач — пересказать, сократить, упростить — этого хватает. Но когда задача сложнее, начинаются проблемы. Мы разрабатываем систему, которая автоматически переписывает новости для региональных СМИ. Звучит просто, но на деле нейросеть должна одновременно: вытащить из статьи все факты, проверить что ничего не переврано, найти в архиве издания похожие публикации, переписать в стиле конкретного СМИ и при этом не допустить ошибок. Когда мы пытались решить всё одним запросом, 40% текстов получались плохими. Хуже того — было непонятно, что именно пошло не так. Нейросеть потеряла факт? Написала не в том стиле? Придумала лишнее? Когда всё в одном запросе, разобраться невозможно. Мы разделили задачу на пять отдельных шагов, каждый из которых выполняет своя нейросеть со своей узкой специализацией. Первая извлекает из статьи всё проверяемое: даты, имена, цифры, цитаты.

Мы разрабатываем систему, которая автоматически переписывает новости для региональных СМИ. Звучит просто, но на деле нейросеть должна одновременно: вытащить из статьи все факты, проверить что ничего не переврано, найти в архиве издания похожие публикации, переписать в стиле конкретного СМИ и при этом не допустить ошибок.

Когда мы пытались решить всё одним запросом, 40% текстов получались плохими. Хуже того — было непонятно, что именно пошло не так. Нейросеть потеряла факт? Написала не в том стиле? Придумала лишнее? Когда всё в одном запросе, разобраться невозможно.

Мы разделили задачу на пять отдельных шагов, каждый из которых выполняет своя нейросеть со своей узкой специализацией.

Первая извлекает из статьи всё проверяемое: даты, имена, цифры, цитаты. Вторая сверяет извлечённое с оригиналом — не добавила ли предыдущая нейросеть чего-то лишнего. Третья ищет в архиве издания: писали ли они об этом раньше. Четвёртая пишет текст в стиле конкретного СМИ. Пятая читает результат и оценивает качество. Если плохо — возвращает на переделку.

Каждая нейросеть умеет только одну вещь. И именно поэтому делает её хорошо. Когда просишь одну модель делать всё сразу, она идёт на компромиссы: чуть-чуть проверит факты, чуть-чуть подстроит стиль, но нигде не доведёт до конца.

Один такой переписанный текст обходится в 14 центов — это около 13 рублей. При объёмах в сотни текстов в месяц и тарифах от 30 тысяч рублей это ничтожная доля себестоимости.

Главный результат — прозрачность. Когда текст получается плохим, мы за минуту находим, на каком шаге произошёл сбой, и чиним именно его. Не «давайте перегенерируем и надеяться на лучшее», а конкретная проблема — конкретное решение.

Подробный разбор архитектуры на Хабре

Статья написана с помощью AI-системы «Рерайт-Завод»