Во время стажировки в УИИ мне поручили разработать решение для крупной строительной компании.
Их главный инженер рассказал о проблеме, с которой сталкивается каждый, кто работает в строительном надзоре.
Заранее скажу, что все сложилось хорошо, заказчик доволен, а я попал на лендинг. Но теперь обо всем подробнее.
Представьте: инспектор ходит по стройплощадке, видит нарушение - скажем, неправильно установленную арматуру или нарушение технологии бетонирования.
Дальше начинается цирк: нужно найти в нормативных документах точную формулировку нарушения, переписать её в предписание, указать сроки устранения, оформить по всем правилам. На это уходит 40-60 минут на каждое нарушение.
А ведь инспектор за день может обнаружить десяток проблем. В итоге половина рабочего времени тратится не на контроль качества, а на бюрократическую возню с документами. Плюс человеческий фактор: можно перепутать пункт СНиПа, неточно сформулировать требование или вообще забыть про какое-то нарушение к концу смены.
Поэтому нужно было, сделать так, чтобы инспектор мог говорить боту что видит, а он сам находил нужные пункты и составлял предписания. Чтобы оставалось только распечатать и подписать».
Цели и задачи
Задача казалась одновременно простой и сложной. Простой - потому что логика понятна: услышал нарушение, нашёл в документах, оформил предписание.
Сложной - потому что нормативная база строительства это десятки тысяч страниц СНиПов, ГОСТов, технических регламентов.
Основные цели:
- Сократить время оформления предписаний в 10 раз (с 45 минут до 4-5)
- Исключить ошибки в ссылках на нормативные документы
- Обеспечить работу через Telegram (все инспекторы им пользуются)
- Поддержать голосовой ввод (на стройке в касках и перчатках неудобно печатать)
Ограничения были жёсткие: бюджет небольшой, срок - месяц, плюс система должна работать автономно без постоянной поддержки разработчика.
Поиск решения и реализация
Сначала я изучил, как инспекторы работают сейчас. Оказалось, что они обычно помнят примерные формулировки нарушений, но тратят время на поиск точных ссылок в документах. Значит, нужна была система, которая могла бы по описанию проблемы найти релевантные пункты нормативов.
Классический поиск по ключевым словам здесь не работал - один и тот же дефект можно описать десятком способов. Нужен был семантический поиск, который понимает смысл, а не просто совпадение слов.
Решение строил на основе RAG-архитектуры (Retrieval-Augmented Generation). Принцип такой: берём всю нормативную документацию, разбиваем на смысловые фрагменты, превращаем их в векторные представления и складываем в поисковую базу. Когда приходит запрос, система находит наиболее подходящие фрагменты и на их основе генерирует ответ.
Техническую реализацию делал через связку FAISS для векторного поиска и GPT-4o-mini для генерации предписаний. Telegram-бот получал голосовые сообщения, Whisper переводил речь в текст, дальше включалась RAG-система.
Самой долгой частью оказалась подготовка нормативной базы. Пришлось распарсить около 50 документов - от СНиП 3.03.01 до различных ГОСТов. Каждый документ разбивал на логические блоки с сохранением контекста и метаданных.
Например, если речь идёт о бетонных работах в разделе про фундаменты, эта информация сохранялась.
Результаты
Через три недели разработки запустили пилотный проект с двумя инспекторами. Результаты превзошли ожидания:
Среднее время оформления предписания сократилось с 42 минут до 4 минут. Да, в десять раз, как и планировали.
За первый месяц работы бот обработал 247 запросов с точностью поиска релевантных документов 94%. Только в 15 случаях инспекторам пришлось дорабатывать предписания вручную.
Еще пример из практики
Диктуем боту: «Вижу, что к резервуару газгольдера приварили направляющие с площадками до окончательной сборки и проверки геометрии.».
Бот находит соответствующий пункт 4.93 СНиП 3.03.01-87, который требует производить приварку внешних направляющих только после полной сборки и выверки геометрического положения, и сформировал грамотное предписание с требованием демонтировать неправильно установленные элементы и переделать работы в соответствии с технологией. Сам назначает сроки устранения.
Компания подсчитала экономический эффект: инспектор теперь успевает проверить на 60% больше объектов за смену. При средней стоимости часа работы специалиста экономия составила около 180 тысяч рублей в месяц только на двух сотрудниках.
Неожиданным бонусом стало повышение качества предписаний. Раньше инспекторы иногда ссылались на устаревшие нормы или неточно формулировали требования. Бот всегда использует актуальную редакцию документов и корректную терминологию.
Андрей Владимирович отметил: «Теперь я не боюсь, что пропущу что-то важное или неправильно оформлю предписание. Говорю что вижу, получаю готовый документ. Красота».
Выводы и рекомендации
Главный урок этого проекта - RAG-системы действительно работают в узкоспециализированных областях. Но успех зависит от качества подготовки данных больше, чем от выбора конкретных алгоритмов.
Потратьте время на правильную структуризацию документов. У меня на это ушло 40% всего времени разработки, но именно это обеспечило высокую точность поиска. Каждый фрагмент документа должен сохранять контекст и содержать достаточно информации для понимания.
Голосовой интерфейс оказался не прихотью, а необходимостью. Инспекторы используют бота прямо на стройплощадке, где печатать неудобно. Whisper показал отличное качество распознавания даже в шумной обстановке.
Обязательно закладывайте логирование и аналитику с первого дня. Google Sheets для этого вполне достаточно на начальном этапе. Мы отслеживали частоту запросов, типичные ошибки, время ответа системы.
Не пренебрегайте пользовательским опытом. Бот должен не только правильно отвечать, но и делать это понятным языком. Пришлось несколько раз переписывать промпты для GPT, чтобы ответы были структурированными и удобными для чтения.
Деплой лучше делать на специализированной платформе сразу с настройкой автозапуска. У нас система развёрнута на Beget с использованием systemd - работает стабильно без вмешательства администратора.
Если планируете похожий проект, рекомендую начать с минимально жизнеспособного продукта. Сначала сделайте простой поиск по документам, потом добавляйте генерацию ответов, интеграции и дополнительные фишки.
RAG - хороший инструмент. Но в правильных руках он может кардинально изменить рутинные процессы в любой экспертной области, где много документооборота и нужен быстрый поиск информации.
Если понравилось, лайкните,а если нужна реализация-пишите.