10 подписчиков

⚡️80% точности без CAPEX на обучение: решение для промышленного RAG

7 мая7 мая

1 мин

Внедрение GenAI в промышленности упирается в одну и ту же проблему: отраслевые данные уникальны, а размеченных датасетов для fine-tuning почти нет. Стоимость обучения специальных моделей может быть существенной при этом результат непредсказуем. Кейс из практики нашей команды: каталог промышленного оборудования, сотни тысяч SKU. ❗️Задача — обеспечить точность подбора номенклатуры по текстовому запросу на уровне 80%+. Классический путь — RAG с reranker'ом, валидационными данными и итеративным тюнингом гиперпараметров — требовал ресурсов, которых у заказчика не было. 👌Решение: Базовый RAG без дополнительной оптимизации давал 50–60% точности. Вместо того чтобы усложнять пайплайн, мы увеличили выдачу в ~10 раз и передавали расширенный контекст в модель с окном 128K+. Модель самостоятельно фильтровала нерелевантные позиции, опираясь на логику всей выборки. 🔘Результат: — Целевые 80% точности достигнуты — Нулевые CAPEX на рост качества — Устойчивость к изменениям в каталоге за счет мощно

Кейс из практики нашей команды: каталог промышленного оборудования, сотни тысяч SKU.

❗️Задача — обеспечить точность подбора номенклатуры по текстовому запросу на уровне 80%+. Классический путь — RAG с reranker'ом, валидационными данными и итеративным тюнингом гиперпараметров — требовал ресурсов, которых у заказчика не было.

👌Решение:

Базовый RAG без дополнительной оптимизации давал 50–60% точности. Вместо того чтобы усложнять пайплайн, мы увеличили выдачу в ~10 раз и передавали расширенный контекст в модель с окном 128K+. Модель самостоятельно фильтровала нерелевантные позиции, опираясь на логику всей выборки.

🔘Результат:

— Целевые 80% точности достигнуты

— Нулевые CAPEX на рост качества

— Устойчивость к изменениям в каталоге за счет мощной LLM на финальном шаге

Стоимость решения — увеличенный расход токенов.

По данным Gartner, в 2026 году 55% инфраструктурных затрат на AI придётся именно на inference, а не на обучение — тренд, который делает такой подход экономически оправданным уже сейчас.

Вывод: прежде чем инвестировать в сложный ML-пайплайн, проверьте, не решается ли задача увеличением объёма контекста.

⚡️Ускорение промышленных процессов с помощью ИИ — одна из экспертиз нашей команды. Поможем внедрить GenAI оптимальным способом на основе опыта 30+ реализованных проектов.

💙 Перейти на сайт

🤖 Написать в TG

⚡️ Написать в MAX