Необходимость поддерживать управление как непосредственно самими знаниями, так и семантической моделью (а в ряде особо сложных случаях поддерживается несколько альтернативных семантических моделей баз знаний) приводит к ряду архитектурных и функциональных требований в отношении эффективных систем управления знаниями. Что во многом и формирует отличие систем управления знаниями от более простых в отношении структурирования информации систем управления контентом.
В базовом варианте от системы управления знаниями (KMS) требуется:
- в автоматизированном режиме обеспечивать ввод и вывод знаний в различных форматах;
- поддерживать программирование семантической модели знаний;
- производить обработку (анализ) знаний на основе семантической модели.
Обозначенные требования имплементируются системой управления знаний с помощью функционала, обеспечивающего сквозной процесс работы со знаниями: начиная от управляемого ввода исходной информации и вплоть до параметризированного вывода (UI или API) запрашиваемой информации. Этот сквозной процесс описывается моделью сборки знаний.
Модель сборки знаний в системе управления знаниями – это правила и методы ввода (принятия в систему) информации (от пользователей или иных систем) и вывода (выдачи из системы) информации (по запросам пользователей или иных систем), реализованные как часть функционала системы, которые позволяют эффективно обрабатывать по всей цепочке информацию сохраняя её технологическую, содержательную и смысловую целостность.
Для модели сборки определяющим является формат хранения информации, поскольку он существенным образом влияет на правила и методы ввода информации, на способы извлечения информации и на вывод информации клиенту системы (пользователю или другой системе).
Примечание. Под форматом хранения информации в системе управления знаниями понимается не технологический формат хранения данных системой (это часто реляционные базы данных), а то в каком виде сама система без дополнительной обработки непосредственно сохраняет и использует (обрабатывает) единицу описания знаний. Как правило, для квалифицированного пользователя или администратора, модель сборки предусматривает прямой доступ к сохраненной информации в таком формате для контроля или непосредственной правки.
В качестве базовых и даже обязательных для любой KMS можно выделить следующие форматы хранения единиц информации:
- Страница (размеченная страница текста) – информация сохраняется в виде текста (последовательный набор символов), состоящего из непосредственного смыслового содержания и управляющих инструкций (служебная разметка).
- Структура данных – информация сохраняется в виде размеченного текста в одном из форматов, обрабатываемых системой как описанные упорядоченные данные (примером могут служить такие стандарты как XML, JSON, CSV, CSS).
- Скрипт (код обработки) – информация сохраняется в виде программного кода на поддерживаемом языке программирования.
- Таблица данных – информация непосредственно сохраняется как отдельная таблица или как часть отдельной таблицы.
- Изображение – информация сохраняется в виде графического статичного изображения.
- Схема – информация сохраняется в виде графического статичного изображения, дополненного данными, размечающими на нём отдельные семантические единицы и их связи.
- Аудио – информация о воспроизводимом звуке (может дополняться разметкой и описанием отдельных фрагментов).
- Видео – информация о воспроизводимом видеоизображении (может дополняться разметкой и описанием отдельных фрагментов, а также маркировкой отдельных семантических единиц и их связей).
При этом технической единицей хранения для каждого из обозначенных форматов может быть непосредственно связанный файл в соответствующей поддерживаемой кодировке или последовательность байтов, записанная в одном и более полях/объектах базы данных. Допустимы, но менее распространены, иные виды единиц хранения.
Модель сборки знаний определяет следующие этапы процесса:
- Ввод – сбор знаний, т.е. внесение данных в систему.
- Хранение – форматирование и принципы сохранения знаний, т.е. запись данных в хранилище системы.
- Извлечение – способы и инструменты получения знаний, т.е. извлечение данных из хранилища системы.
- Вывод – формат и принципы представления знаний, т.е. преобразование и передача данных пользователю посредством UI или другой системе посредством API.
На этапе ввода – приема информации в систему – осуществляется обработка входящих единиц описания знаний на правильность и целостность, как в части формата и корректности данных, так и в части соответствия семантической модели. Если принимаемая информация содержит какие-либо управляющие инструкции (разметку), то система управления знаниями может их обработать и сохранить отдельно, как часть метаданных или семантической модели.
На этапе извлечения – выборки из хранилища – осуществляется обработка другого типа, которая выбирает требуемую информацию из хранилища и связывает её в целостную единицу вывода на основе имеющихся метаданных и семантической модели. Если информация, подлежащая выводу, содержит управляющие инструкции (разметку), то система управления знаниями на её основе производит дополнительные вычисления и специальную обработку контента, предусмотренную такими управляющими инструкциями.
На этапе вывода – передача в интерфейс – осуществляется обработка, преобразующая подготовленную к выводу информацию в информацию, которая корректно будет отображена пользователю в UI или принята в рамках установленного контракта другой системой посредством API. При этом информация, передаваемая через UI пользователю, может быть дополнена статическими элементами (оформление, форматирование) и динамическими (скрипты, встраиваемые элементы). А информация, передаваемая через API, может быть дополнена метаданными, служебной информацией или сведениями о семантической модели.
Для всех этапов модели сборки знаний справедливо следующее:
KMS должна поддерживать простую и/или программируемую семантическую модель. Существует связанная с поддержкой семантической модели задача, присущая в том числе и наиболее продвинутым CMS. А именно – в автоматизированном режиме собирать контент из различных фрагментов под запросы клиентов системы. Следовательно, эффективная система управления знаниями должна включать функционал по обработке специальных управляющих инструкций (разметки) присутствующих во вводимой и выводимой информации. Такой функционал в ряде KMS называется «парсер контента» и он позволяет программировать обработку информации с помощью специальной синтаксически правильной разметки и автоматизировать работу со знаниями и их семантической моделью. Т.е. с помощью управляющих инструкций (разметки) можно определять правила вычисления конкретной единицы описания знаний или отдельного её фрагмента как в части содержание и формата, так и в части структуры и атрибутов (метаданных и элементов семантики). Управляющие инструкции в том числе используются для семантической аннотации –маркировка в потоке информации смысловых единиц и их связей.
Управляющие инструкции позволяют:
- изменять заданный способ обработки единицы описания знаний или её фрагмента
а) добавлять или исключать типовые (стандартные) блоки информации
б) изменять порядок, формат и форматирование информации
в) регулировать обработку информации в зависимости от прав клиента системы - динамически вычислять единицу описания знаний или её фрагмента, в том числе:
а) включать одни единицы или их отдельные фрагменты в другие
б) вычислять единицы и фрагменты на основе передаваемых параметров
в) включать динамически изменяющиеся данные и переменные - выделять внутри одной единицы описания знаний другие единицы или фрагменты
а) размечать или добавлять метаданные
б) размечать или добавлять элементы семантической модели и их атрибуты
В зависимости от назначения, способа обработки и получения единиц описания знаний в KMS, а также учитывая степень влияния на конечный результат обработки и вывода информации клиенту системы, следует различать:
- основные единицы описания знаний – фактически определяют знания и их семантику;
- управляющие единицы – определяют состав и типологию семантической модели и используются в процессе сборки знаний для вычисления и построения целостных основных единиц описания знаний;
- навигационные и вспомогательные единицы – вычисляются из основных и управляющих единиц (в том числе результаты запросов) для различных задач по повышению ценности знаний для пользователей за счет связывания между собой отдельных семантических элементов и представления их в запрашиваемом виде (например: списки, категории, классификаторы, результаты поисковых и семантических запросов, облака тегов, указатели, навигаторы).
Автор: Владислав Тюрин, эксперт по цифровой трансформации.
Примечание:
Определения некоторых используемых понятий приведены в статье: «40 понятий менеджмента знаний и компетенций».
Рекомендуется также для ознакомления статья: «Знания, управление знаниями и системы управления знаниями».