Найти тему
Digital Economist

Модель сборки знаний

Необходимость поддерживать управление как непосредственно самими знаниями, так и семантической моделью (а в ряде особо сложных случаях поддерживается несколько альтернативных семантических моделей баз знаний) приводит к ряду архитектурных и функциональных требований в отношении эффективных систем управления знаниями. Что во многом и формирует отличие систем управления знаниями от более простых в отношении структурирования информации систем управления контентом.

В базовом варианте от системы управления знаниями (KMS) требуется:

  • в автоматизированном режиме обеспечивать ввод и вывод знаний в различных форматах;
  • поддерживать программирование семантической модели знаний;
  • производить обработку (анализ) знаний на основе семантической модели.

Обозначенные требования имплементируются системой управления знаний с помощью функционала, обеспечивающего сквозной процесс работы со знаниями: начиная от управляемого ввода исходной информации и вплоть до параметризированного вывода (UI или API) запрашиваемой информации. Этот сквозной процесс описывается моделью сборки знаний.

Модель сборки знаний в системе управления знаниями – это правила и методы ввода (принятия в систему) информации (от пользователей или иных систем) и вывода (выдачи из системы) информации (по запросам пользователей или иных систем), реализованные как часть функционала системы, которые позволяют эффективно обрабатывать по всей цепочке информацию сохраняя её технологическую, содержательную и смысловую целостность.

Для модели сборки определяющим является формат хранения информации, поскольку он существенным образом влияет на правила и методы ввода информации, на способы извлечения информации и на вывод информации клиенту системы (пользователю или другой системе).

Примечание. Под форматом хранения информации в системе управления знаниями понимается не технологический формат хранения данных системой (это часто реляционные базы данных), а то в каком виде сама система без дополнительной обработки непосредственно сохраняет и использует (обрабатывает) единицу описания знаний. Как правило, для квалифицированного пользователя или администратора, модель сборки предусматривает прямой доступ к сохраненной информации в таком формате для контроля или непосредственной правки.

В качестве базовых и даже обязательных для любой KMS можно выделить следующие форматы хранения единиц информации:

  1. Страница (размеченная страница текста) – информация сохраняется в виде текста (последовательный набор символов), состоящего из непосредственного смыслового содержания и управляющих инструкций (служебная разметка).
  2. Структура данных – информация сохраняется в виде размеченного текста в одном из форматов, обрабатываемых системой как описанные упорядоченные данные (примером могут служить такие стандарты как XML, JSON, CSV, CSS).
  3. Скрипт (код обработки) – информация сохраняется в виде программного кода на поддерживаемом языке программирования.
  4. Таблица данных – информация непосредственно сохраняется как отдельная таблица или как часть отдельной таблицы.
  5. Изображение – информация сохраняется в виде графического статичного изображения.
  6. Схема – информация сохраняется в виде графического статичного изображения, дополненного данными, размечающими на нём отдельные семантические единицы и их связи.
  7. Аудио – информация о воспроизводимом звуке (может дополняться разметкой и описанием отдельных фрагментов).
  8. Видео – информация о воспроизводимом видеоизображении (может дополняться разметкой и описанием отдельных фрагментов, а также маркировкой отдельных семантических единиц и их связей).

При этом технической единицей хранения для каждого из обозначенных форматов может быть непосредственно связанный файл в соответствующей поддерживаемой кодировке или последовательность байтов, записанная в одном и более полях/объектах базы данных. Допустимы, но менее распространены, иные виды единиц хранения.

Модель сборки знаний определяет следующие этапы процесса:

  1. Ввод – сбор знаний, т.е. внесение данных в систему.
  2. Хранение – форматирование и принципы сохранения знаний, т.е. запись данных в хранилище системы.
  3. Извлечение – способы и инструменты получения знаний, т.е. извлечение данных из хранилища системы.
  4. Вывод – формат и принципы представления знаний, т.е. преобразование и передача данных пользователю посредством UI или другой системе посредством API.

На этапе вводаприема информации в систему – осуществляется обработка входящих единиц описания знаний на правильность и целостность, как в части формата и корректности данных, так и в части соответствия семантической модели. Если принимаемая информация содержит какие-либо управляющие инструкции (разметку), то система управления знаниями может их обработать и сохранить отдельно, как часть метаданных или семантической модели.

На этапе извлечениявыборки из хранилища – осуществляется обработка другого типа, которая выбирает требуемую информацию из хранилища и связывает её в целостную единицу вывода на основе имеющихся метаданных и семантической модели. Если информация, подлежащая выводу, содержит управляющие инструкции (разметку), то система управления знаниями на её основе производит дополнительные вычисления и специальную обработку контента, предусмотренную такими управляющими инструкциями.

На этапе выводапередача в интерфейс – осуществляется обработка, преобразующая подготовленную к выводу информацию в информацию, которая корректно будет отображена пользователю в UI или принята в рамках установленного контракта другой системой посредством API. При этом информация, передаваемая через UI пользователю, может быть дополнена статическими элементами (оформление, форматирование) и динамическими (скрипты, встраиваемые элементы). А информация, передаваемая через API, может быть дополнена метаданными, служебной информацией или сведениями о семантической модели.

Для всех этапов модели сборки знаний справедливо следующее:

KMS должна поддерживать простую и/или программируемую семантическую модель. Существует связанная с поддержкой семантической модели задача, присущая в том числе и наиболее продвинутым CMS. А именно – в автоматизированном режиме собирать контент из различных фрагментов под запросы клиентов системы. Следовательно, эффективная система управления знаниями должна включать функционал по обработке специальных управляющих инструкций (разметки) присутствующих во вводимой и выводимой информации. Такой функционал в ряде KMS называется «парсер контента» и он позволяет программировать обработку информации с помощью специальной синтаксически правильной разметки и автоматизировать работу со знаниями и их семантической моделью. Т.е. с помощью управляющих инструкций (разметки) можно определять правила вычисления конкретной единицы описания знаний или отдельного её фрагмента как в части содержание и формата, так и в части структуры и атрибутов (метаданных и элементов семантики). Управляющие инструкции в том числе используются для семантической аннотации –маркировка в потоке информации смысловых единиц и их связей.

Управляющие инструкции позволяют:

  1. изменять заданный способ обработки единицы описания знаний или её фрагмента
    а) добавлять или исключать типовые (стандартные) блоки информации
    б) изменять порядок, формат и форматирование информации
    в) регулировать обработку информации в зависимости от прав клиента системы
  2. динамически вычислять единицу описания знаний или её фрагмента, в том числе:
    а) включать одни единицы или их отдельные фрагменты в другие
    б) вычислять единицы и фрагменты на основе передаваемых параметров
    в) включать динамически изменяющиеся данные и переменные
  3. выделять внутри одной единицы описания знаний другие единицы или фрагменты
    а) размечать или добавлять метаданные
    б) размечать или добавлять элементы семантической модели и их атрибуты

В зависимости от назначения, способа обработки и получения единиц описания знаний в KMS, а также учитывая степень влияния на конечный результат обработки и вывода информации клиенту системы, следует различать:

  • основные единицы описания знаний – фактически определяют знания и их семантику;
  • управляющие единицы – определяют состав и типологию семантической модели и используются в процессе сборки знаний для вычисления и построения целостных основных единиц описания знаний;
  • навигационные и вспомогательные единицы – вычисляются из основных и управляющих единиц (в том числе результаты запросов) для различных задач по повышению ценности знаний для пользователей за счет связывания между собой отдельных семантических элементов и представления их в запрашиваемом виде (например: списки, категории, классификаторы, результаты поисковых и семантических запросов, облака тегов, указатели, навигаторы).

Автор: Владислав Тюрин, эксперт по цифровой трансформации.

Примечание:

Определения некоторых используемых понятий приведены в статье: «40 понятий менеджмента знаний и компетенций».

Рекомендуется также для ознакомления статья: «Знания, управление знаниями и системы управления знаниями».