Многие специалисты сталкиваются с необходимостью построения модели данных: «потребители» запрашивают данные и хотят понимать их структуру, особенности обработки и проч. – для этого нужно хорошо понимать откуда берутся данные.
И ещё. В наших статьях мы нередко ссылаемся или просто упоминаем документ под названием «Паспорт информационного ресурса». Это именно тот документ, который помогает ответить на вопрос выше. Подробнее о нём и зачем он нужен мы постараемся сейчас разобраться. Напомним, в нашем блоге мы пишем в первую очередь о государственных данных - и это эта статья тоже про них.
Как это возникает и зачем?
Первое, что приходит в голову – что это некий документ, который по определению есть у каждой информационной системы, типа «паспорта технического средства» или «паспорта гражданина». Нет. У информационных систем есть технические задания на разработку, руководства пользователей и администраторов и т.п.
Под паспортом информационного ресурса (ПИР) мы понимаем документ, являющийся продуктом аудита этого ресурса, содержащего государственные данные. Это проверка и диагностика, предназначенная для оценки того, насколько полно, качественно, законно и оптимально выстроены информационные потоки.
Встав перед необходимостью построения модели государственных данных, мы разработали шаблон паспорта информационного ресурса, по которому стали проводить исследование-диагностику уже работающих процессов.
Составление паспортов помогает понять откуда и как реально возникают данные – поэтому этот процесс критически важный этап цифровизации государства. На основании этих документов можно осуществить инвентаризацию нескольких информационных ресурсов, выявлять связи данных, обнаруживать двойной ввод данных, делать анализы существующих процессов и моделировать возможные новые варианты взаимодействий.
Что же указывается в паспорте?
Структура паспорта — по сути это план описания любых систем обработки и хранения государственных данных.
Для любой дальнейшей аналитической работы важно понимать, как функционирует и наполняется ГИР, и знать ответы на вопросы:
- Как и в каком виде ведётся ГИР?
Какая информационная система и программное обеспечение используется, доступна ли для кого-то информация online? - Что является единицей учёта?
Какие поля главные, а какие, по сути, дополнительные? Какие данные создаются при внесении в ресурс, а какие реально дублируют содержание других записей в других ресурсах? - Как строится межведомственное взаимодействие с использованием ГИР?
Как передаются данные в другие ведомства? Как формируются и направляются ответы на официальные запросы? - Насколько доступны данные, содержащиеся в ГИР?
Можно ли посмотреть какую-то их часть гражданину и на каких условиях? Как регламентируется доступ ведомств? - Кто является потребителями данных?
Кто, по замыслу проектировщика (и нормотворца), должен работать в системе, получая доступ к её записям? Кто фактически использует ресурс в своих повседневных задачах? - Откуда возникают новые данные в ГИР?
Как вводятся данные? На основании каких документов и кем? Существует ли модерация или валидация записей? Осуществляется ли импорт данных из сторонних систем?
Кроме общих сведений выше, паспорт состоит из:
- ссылок на регламентирующие работу нормативно-правовые акты: отраслевой закон, распоряжение Правительства РФ, регламент Министерства и т.п. – изучение этих источников определяет сложность внесения тех или иных корректив в работу системы плюс позволяет вообще проверить, насколько фактическое состояние соответствует задуманному регламентированному;
- ссылок на нормативно-справочную информацию для соответствующих объектов, например, территориальные классификаторы ОКТМО, ОКАТО, адресный реестр ФИАС и т.п.;
- описание жизненного цикла данных: при каких событиях возникает запись, какими способами вносится, какие документы должны быть изданы, какие механизмы корректировки, в какие ведомства и в каком объёме передаётся и т.п.;
- описания структуры ресурса – это описание «столбиков» таблицы реестра или таблиц и полей базы данных, а также схемы их взаимосвязей;
Сделали паспорт - что дальше?
Используя библиотеку паспортов информационных ресурсов, мы можем строить масштабную модель данных, оптимизировать пути сбора и учёта информации, вводить механизмы контроля и перепроверки вводимой информации и многое другое.
Один из примеров: Аналитический центр при Правительстве Российской Федерации в ходе пилотного проекта по повышению качества данных в Государственной автоматизированной системе управления (ГАСУ) провёл аудит 268 показателей, описанных в паспортах. По результатам было предложено автоматизировать сбор 130 из них, а по 138 показателям была выявлена потребность в уточнении порядка сбора. Кроме того, по результатам анализа были разработаны предложения по изменению 17 нормативно-правовых актов.
Заполнение паспорта (даже частичное) может пригодиться при решении узких отраслевых задач, например, для подготовки данных для публикации на портале открытых данных. Проработанная паспортная документация поможет в оценке общей отраслевой информатизации региона: по этим данным легко понять достаточно ли автоматизированы процессы, требуются ли какие-то доработки и финансирование.
Итак, мы видим, что структурированные паспорта могут предоставить широкий инструмент для оптимизации и расширения возможностей как работы самого информационного ресурса, так и жизненного цикла соответствующих данных в целом.
Дополнительные материалы: