Кажется, что если речь идёт о нормах и стандартах, то задача простая: найти нужный документ, открыть PDF и посмотреть, что там написано.
На практике всё обычно не так.
Допустим, у вас вопрос по ремонту, приёмке квартиры, смете или спорной ситуации с подрядчиком. Вы находите документ. Потом ещё один. Потом третий. И довольно быстро выясняется, что проблема была не в том, чтобы что-то найти. Проблема в объеме информации.
Именно поэтому мы делали Спроси.Норму не как ещё один поиск по документам, а как инструмент, который помогает быстрее разобраться в вопросе и не утонуть в нормативке.
Главная сложность - не дефицит информации, а её избыток
Когда человек впервые сталкивается с нормативной базой, часто кажется, что проблема в том, что документы трудно найти. Но в реальности документов как раз очень много.
Это огромный массив нормативной документации за разные периоды: архивы, старые документы, действующие документы, замены, обновления, смежные нормы, общие требования. Всё это существует не в виде одного аккуратного справочника, а в виде большой, сложной и неоднородной базы.
То есть вопрос обычно не в духе: “Где бы мне взять хоть какой-нибудь документ?”
Вопрос другой:
? что из этого сейчас актуально
? что относится именно к моему случаю
? какие документы нужно читать вместе
? на что реально можно опираться
И тут обычный поиск уже начинает буксовать.
Почему “просто поиск” не решает задачу?
Даже если вы нашли нужный документ по названию или ключевым словам, это ещё не значит, что вы получили ответ.
В итоге человек может потратить много времени, открыть десятки страниц и всё равно не быть уверенным, что понял правильно.
Мы как раз от этого и отталкивались: людям нужен не просто доступ к архиву документов, а система, которая помогает быстро собрать нужный нормативный контекст и превратить его в понятный вывод.
Что мы сделали под капотом?
Когда мы создавали Спроси.Норму, одной из главных задач был быстрый и точный поиск по большой нормативной базе.
Для этого мы собрали и обработали архив примерно из 530 000–540 000 документов. Это очень большой массив многостраничной нормативной документации из разных периодов.
Но просто иметь такой архив мало. Если просто загрузить все документы в систему и дать по ним поиск, пользователь по-прежнему будет получать слишком много лишнего и тратить время на ручную фильтрацию.
Поэтому мы пошли дальше: не просто собрали базу, а подготовили её к работе с реальными вопросами.
По каждому документу мы стараемся определить несколько важных вещей:
- действует он или нет
- если не действует - чем заменён
- к какой теме относится
- как связан с другими документами по этой же области
Это даёт системе возможность не просто находить текст по словам, а учитывать контекст.
Например, если человек ссылается на старую норму, система может понять, что документ уже неактуален, и посмотреть, что пришло ему на замену. Если вопрос затрагивает смежные темы, это тоже можно учесть, а не ограничиваться одним узким совпадением.
По сути, для нас было важно сделать не “поиск по PDF”, а поиск по смыслу задачи.
Как это работает в реальном вопросе?
Когда пользователь задаёт вопрос, система сначала определяет, о какой области идёт речь и какие темы рядом с ней могут быть важны.
После этого начинается подбор документов.
Сначала отбираются наиболее релевантные нормативы именно по теме вопроса. Обычно это не бесконечный список, а конкретная рабочая выборка - примерно 10–30 документов, которые действительно ближе всего к запросу.
Параллельно система подбирает и более общие документы, которые могут быть важны для корректного ответа. Например: общие требования, стандарты, базовые нормативы по размерам, допускам и оформлению, документы, которые задают общий контекст.
В итоге получается уже расширенная подборка - обычно около 20-40 документов, с которыми система и работает дальше. То есть на выходе берётся не случайный набор файлов, а нормативный контекст, которого достаточно, чтобы ответить по существу.
Почему ответ не строится "за один раз"?
Это тоже важный момент.
Мы не хотели делать систему, которая просто быстро генерирует первый попавшийся текст. Поэтому ответ проходит несколько этапов. Сначала на основе вопроса, правил работы системы и подобранных документов формируется первый вариант ответа.Потом запускается проверка. Система дополнительно анализирует:
• всё ли важное учтено
• достаточно ли полный ответ получился
• нет ли слабых мест по достоверности
• не требуется ли уточнение или правка
Если замечания есть, ответ дорабатывается.
И только после этого он приводится к понятной структуре: чтобы у пользователя был не сплошной текст, а ответ, в котором можно быстро увидеть главное, нормативную опору и применимость.
Проверка в интернете
Нормативная база - это живая среда. Она пополняется и меняется.
Поэтому, помимо собственной базы документов, на этапе проверки используется и дополнительный поиск по профильным источникам в интернете. Это помогает перепроверять актуальность и видеть свежий контекст, если где-то произошли изменения раньше, чем они успели попасть в обновление базы.
Здесь важно правильно понять логику.
Основа ответа - это именно нормативные документы. Но дополнительная проверка по профильным источникам помогает убедиться, что система не опирается на устаревший контекст и не пропускает важные изменения.
Что человек получает в итоге
Для пользователя всё это нужно не ради красивой технической схемы.
На практике человек получает не просто список документов и не длинную простыню текста, а более понятный результат:
- вывод по вопросу
- нормативную опору
- пояснение, почему ответ именно такой
- понимание применимости
- структурированную подачу без лишнего хаоса
То есть задача Спроси.Норму - не завалить человека документами, а помочь ему быстрее прийти к ясности.
Зачем всё это было делать именно так?
Потому что в стройке, ремонте, сметах и приёмке жилья проблема очень редко звучит как “мне негде найти PDF”. Обычно проблема звучит иначе:
• Я нашёл документы, но не понимаю, что из них главное
• Неясно, действует это или уже нет
• Есть много информации, но нет уверенности, как применить её к своей ситуации
• Хочется не читать всё подряд, а быстрее разобраться
И вот здесь обычного поиска уже недостаточно.
Поэтому Спроси.Норму мы и делаем не как архив документов, а как помощника, который помогает пройти путь от вопроса до понятного ответа.
Под капотом Спроси.Норму нет идеи "давайте просто загрузим много файлов и дадим поиск".
Подход другой:
- собрать большую нормативную базу
- подготовить её к осмысленному поиску
- учитывать статус документов и их связи
- подбирать не один файл, а релевантный контекст
- проверять и дорабатывать ответ
- отдавать пользователю результат в понятной структуре
Потому что хороший ответ по нормам - это не просто найденный документ. Это ситуация, когда после ответа становится понятнее, а не сложнее.
Именно поэтому Спроси.Норму мы делаем не только для специалистов. Мы делаем его для всех людей - чтобы разбираться в сложных вопросах было быстрее, понятнее и спокойнее.
Спроси.Норму | МАХ | ВК | Telegram