Искусственный интеллект в бизнесе часто связывают с большими языковыми моделями — LLM (от англ. large language model — «большая языковая модель»). Они умеют работать с разными задачами: писать тексты, анализировать документы, отвечать на вопросы, помогать с кодом и искать идеи.
Чтобы быть в курсе важных трендов и мнений ведущих экспертов, следите за нами в канале в Max.
Но в корпоративных процессах не всегда нужен универсальный инструмент. Часто бизнесу важнее другое: быстро обработать обращение, найти пункт в регламенте, извлечь данные из договора, подготовить типовой ответ или помочь сотруднику заполнить отчёт.
Для таких задач подходят малые языковые модели — SLM (от англ. small language model — «малая языковая модель»). Это не «слабая версия» большой модели, а специализированный ИИ-инструмент под конкретный процесс. Если большая модель похожа на универсального эксперта, то малая — на сотрудника с узкой специализацией: она не решает всё сразу, зато хорошо справляется с задачей, под которую её настроили.
По оценкам аналитиков, компании будут всё чаще переходить от универсальных моделей к специализированным. Причина проста: если операция повторяется тысячи раз, требует скорости, понятной стоимости и контроля над данными, компактная модель может быть практичнее большой.
Ниже — алгоритм внедрения малой языковой модели.
Определите, нужна ли бизнесу именно малая языковая модель
Малые языковые модели обычно проектируют под узкую задачу и обучают или донастраивают на специализированных данных: юридических документах, финансовой отчётности, технических инструкциях, клиентских обращениях.
За счёт этого SLM (от англ. small language model — «малая языковая модель») могут точнее работать с профессиональной терминологией и лучше учитывать контекст процесса. Например, модель для бухгалтерии не обязана писать рекламные тексты, а модель для службы поддержки — анализировать стратегию компании. Её задача — быстро и стабильно решать повторяющиеся вопросы в заданных границах.
SLM особенно полезны, если компании важно:
- обрабатывать большое количество однотипных запросов;
- снизить стоимость работы с искусственным интеллектом;
- развернуть решение внутри корпоративного контура;
- работать с конфиденциальными документами;
- ускорить типовые операции без полной перестройки ИТ-инфраструктуры.
При этом малые модели не заменяют все ИИ-инструменты. Они хуже подходят для задач, где нужно выстаивать длинную логическую цепочку, делать сложный анализ сразу нескольких областей, требуется высокая креативность или работа с разными типами данных одновременно, например с текстом и аудио.
Ещё статьи по теме нейросетей:
Из другого мира: как построить карьеру в сфере искусственного интеллекта без профильного образования
От помощника к единомышленнику. Как ИИ трансформирует подход к управлению бизнесом
Библиотекарь для нейросети: как генерация с дополненным поиском повышает точность ИИ
Три сценария эффективности: как использовать ИИ-агентов для ускорения рабочих процессов
Выберите конкретный сценарий применения
Внедрение SLM (от англ. small language model — «малая языковая модель») лучше начинать не с выбора технологии, а с поиска понятной бизнес-задачи. Подходящий сценарий обычно повторяется регулярно, имеет понятные входные данные и измеримый результат.
На практике малые языковые модели чаще всего применяют в нескольких направлениях.
- Клиентская поддержка. Модель может классифицировать обращения, предлагать типовые ответы, кратко пересказывать диалоги, определять тональность сообщений и выделять жалобы.
- Работа с документами. Компактный ИИ помогает извлекать данные из договоров, классифицировать документы, искать нужные фрагменты в инструкциях, суммировать отчёты и проверять наличие обязательных блоков.
- Внутренние ИИ-ассистенты. Модель может отвечать сотрудникам на вопросы по базе знаний, объяснять регламенты, помогать заполнять формы и находить информацию в корпоративных системах.
- Аналитика коммуникаций. SLM используют для расшифровки разговоров, выделения ключевых тем, контроля качества операторов и выявления повторяющихся проблем клиентов.
- Финансы и соответствие требованиям. Модель помогает искать риски в документах, проверять договоры, сопоставлять текст с внутренними правилами и готовить первичные выводы для специалиста.
Для начала лучше выбрать самый простой сценарий. Например, научить модель находить ответы на типовые вопросы по регламенту отдела закупок.
Опыт внедрения нейросетей в российские компании — в разделе «Кейсы» СберПро.
Подготовьте данные для настройки модели
Качество малой языковой модели зависит от данных. Если документы устарели, противоречат друг другу или не отражают реальную практику, модель будет воспроизводить эти ошибки.
Перед запуском нужно собрать материалы, которые описывают выбранный процесс: регламенты, инструкции, типовые ответы, историю обращений, договоры, отчёты, внутренние справочники, переписки.
Важно проверить, что:
- документы оцифрованы и доступны для загрузки;
- в материалах нет дублей, устаревших версий и противоречий;
- данные отражают реальные рабочие ситуации;
- чувствительная информация размечена или исключена;
- у команды есть право использовать данные для настройки ИИ-системы.
Компании редко обучают малые языковые модели с нуля. Чаще берут готовую модель и адаптируют её под свою область. Один из подходов — дообучение на специальных текстах. Другой — настройка способа разбиения текста на токены (от англ. token — «знак»).
Токен — это минимальная единица текста, с которой работает модель: слово, часть слова, символ или пробел. Если модель часто обрабатывает таблицы, технические обозначения или специальные сокращения, настройка токенизации может повысить точность работы.
Назначьте владельца результата
SLM (от англ. small language model — «малая языковая модель») не должна оставаться только ИТ-проектом. За качество результата нужен ответственный со стороны бизнеса: руководитель направления, методолог, эксперт подразделения или опытный специалист.
Такой человек помогает определить, какие ответы модели считать правильными, какие ошибки критичны, а какие допустимы на этапе пилота. Например, для службы поддержки важны скорость и корректный тон общения. Для юридического блока — точность формулировок. Для производства — правильное описание аномалий и отсутствие неверных рекомендаций.
На старте стоит разделить роли:
- бизнес-владелец описывает задачу и критерии качества;
- ИТ-команда или подрядчик отвечает за настройку модели и интеграцию;
- эксперты предметной области проверяют ответы;
- служба безопасности оценивает риски работы с данными;
- финансовый или операционный блок помогает посчитать эффект.
Такой подход снижает риск, что модель заработает, но не приживётся.
Выберите среду размещения
Одно из преимуществ малых языковых моделей — гибкость развёртывания. Их можно запускать на более скромных вычислительных ресурсах, чем большие модели. В отдельных сценариях компактный ИИ работает локально: на сервере компании, устройстве сотрудника, промышленном контроллере или другом оборудовании рядом с источником данных.
Выбор среды зависит от требований к безопасности, скорости и стоимости.
Если компания работает с персональными данными, коммерческой тайной, банковской информацией, конструкторской документацией или другими чувствительными материалами, может потребоваться размещение внутри собственного контура. Такой подход даёт больше контроля над данными и настройками.
Облачная инфраструктура удобна, когда нужно быстро запустить пилот, гибко масштабировать мощности и не закупать оборудование заранее. Но перед выбором облака важно проверить условия хранения данных, стоимость роста нагрузки, доступность сервиса и соглашение об уровне услуг.
О плюсах и минусах работы в облаке читайте в статье «Облака и AI: как компании создают инфраструктуру для роста и гибкости».
Для некоторых процессов подходит смешанная архитектура: малая модель обрабатывает массовые типовые запросы внутри контура, а большая подключается только для сложных задач, где нужен более широкий контекст.
Запустите пилот и определите метрики успеха
Пилот нужен для проверки бизнес-гипотезы. Он должен показать, решает ли SLM конкретную задачу лучше, быстрее или дешевле текущего процесса.
Лучше ограничить пилот одним сценарием и сроком, достаточным для оценки результата. Ориентир — 2–3 месяца. За это время можно собрать статистику, проверить качество ответов, выявить типовые ошибки и понять, готов ли процесс к масштабированию.
Метрики стоит выбрать до запуска. Это могут быть:
- скорость обработки обращения или документа;
- доля корректных ответов;
- снижение ручной нагрузки на сотрудников;
- количество ошибок, которые требуют вмешательства эксперта;
- стоимость обработки одного запроса;
- удовлетворённость пользователей внутри компании или клиентов.
Важно оценивать не только средний результат, но и критические ошибки. Если модель быстро обрабатывает документы, но иногда неверно извлекает важные реквизиты, такой риск нужно учитывать отдельно.
Внедрите контроль качества
Малая языковая модель должна работать в понятных границах. Её не стоит превращать в универсального советника, если она обучена на узком наборе данных. Чем точнее описана зона ответственности, тем проще контролировать результат.
На практике нужно заранее определить:
- какие задачи модель выполняет самостоятельно;
- где требуется подтверждение сотрудника;
- какие ответы модель не должна давать;
- как фиксируются ошибки;
- кто обновляет данные и правила работы;
- как часто проводится повторная проверка качества.
Например, в документообороте SLM (от англ. small language model — «малая языковая модель») может извлекать данные и предлагать классификацию, но финальное решение остаётся за специалистом. В поддержке модель может подготовить черновик ответа, а оператор — проверить его перед отправкой. В корпоративной базе знаний модель может показывать ссылку на источник, чтобы сотрудник видел, откуда взята информация.
Оцените масштабирование
Если пилот оказался успешным, следующий вопрос — как решение поведёт себя при росте нагрузки? Для этого нужно заранее оценить, сможет ли инфраструктура выдержать увеличение числа запросов в 5–10 раз, сколько будет стоить масштабирование и какие подразделения смогут использовать модель дальше.
Масштабирование может идти по двум направлениям. Первый вариант — расширить один сценарий: подключить к ИИ-ассистенту больше сотрудников или добавить новые разделы в базы знаний. Второй — создать несколько специализированных моделей для разных задач: одну для документооборота, другую для клиентской поддержки, третью для отчётности.
Так формируется система специализированных помощников. Каждый решает свою задачу, работает с нужными данными и помогает сотрудникам быстрее проходить рутинные этапы процесса.
Малые языковые модели особенно полезны там, где бизнесу нужен не эффект новизны, а измеримая практическая польза: меньше ручной работы, быстрее обработка информации, ниже стоимость запроса и выше контроль над данными. Поэтому внедрение стоит начинать с вопроса: какая повторяющаяся задача уже сегодня тратит слишком много времени, денег и внимания специалистов?
Больше технических подробностей о малых языковых моделях, стоимость их внедрения, а также комментарии экспертов в этой теме — в статье на СберПро.
Подпишитесь на рассылку СберПро: два раза в месяц присылаем дайджест с кейсами, анонсами статей и событий для крупного бизнеса.
Подписаться