Найти в Дзене
Пользовательские структуры метаданных

Пользовательские структуры метаданных

Пользователь может организовать метаданные по своему усмотрению. Данные разных предметных областей и под различными взглядами организуются по разному. Одним данным нужна группировка, другим - статистическая обработка или наличие структур связей.
подборка · 3 материала
Связи и функции обработки, выявляющие новые связи. Общеизвестно, что связи со временем изменяются одни обрываются, у других меняются свойства. Поэтому в свойствах связей создают поля временной актуальности, т.е. свойства синхронизации событий, явлений, состояний и т.п. Обычно поля называют "date_from" и "date_to"?, наши "с, по". Объекты с такими полями называют историческими. Если таких объектов много, то и сами базы и хранилища данных называют историческими. Так вот, есть данные, которые постоянно пополняются из разных источников и пополняют базу или хранилище данных. Данных и так много, но чтобы анализировать данные, нужны данные, выявляющие закономерности и порождающие новые связи. Например, есть два события. Нужно найти связи, по которым можно связать эти события, а прямой связи между событиями нет. Вот и нужны цепочки связей, по которым ищется связь между событиями и создается прямая связь с выявленной цепочкой связей в качестве функции обработки. А помогают в этом данные объекта БС. Для поиска генерируется SQL или иной запрос к объектам БС или к цепочкам БС, в котором в условии запроса участвует ID исходного объекта и в другом условии - ID конечного объекта. Запрос имеет цикличность по количеству БС в цепочке. Сперва генерируется запрос для 1 БС, затем - для 2, и т.д. до N количества БС в цепочке. Когда находятся связи по разным длинам цепочки БС, то создаются структуры БС - объекты типа цепочки. Другими функциями создаются совсем неявные связи на основе статистических методов. Также связи создаются тематическими запросами к данным. Запросы, как функции обработки, можно структурировать как объекты с метаданными. Тогда к созданной БС в качестве свойств можно привязать структуру запроса, создающего БС. А если есть структура запроса, то можно найти все БС, созданные схожими по структуре запросами. В данном случае структура запроса будет являться метаданными. Так данные могут выступать в качестве метаданных.
Структуры связей в качестве данных. При более подробном рассмотрении структур связей можно обнаружить, что направление, порядок и описание связей очень важно и определяет на первый взгляд незаметный смысл данных. БС связи могут быть однонаправленными и двунаправленными, что отражается в свойствах БС. Двунаправленной является БС со свойством "синонимы". Агрегат БС содержит БС вида: (ID_object1, ID_object2), (ID_object1, ID_object3), (ID_object1, ID_object4) и т.д. То есть первым объектом является объект, который объединяет (агрегирует) связанные с ним объекты. Цепочка БС содержит БС вида: (ID_object1, ID_object2), (ID_object2, ID_object3), (ID_object3, ID_object4) и т.д. Иерархия БС содержит БС вида: (ID_object1, ID_object1), (ID_object1, ID_object1), (ID_object1, ID_object1) и т.д. Порядок БС в структурах и содержание свойств БС иногда содержат очень важный смысл. Что же такое свойства БС? Обязательным свойством БС является ее направление. Самым распространенным свойством БС является её тестовое семантическое описание. К таким описаниям можно отнести пары описаний "часть - целое", "абстрактное - конкретное", "входит в - состоит из" и т.п. Другим свойством БС являются числовые значения - веса.
Данные, структуры связей. В методике RMSL утверждается, что уровней метаданных выше M3 не существует, а существуют все те же уровни M0-M3, но другого семантического уровня. Все алгоритмы обработки данных построены на обработке связей различных операций с данными. Адреса структур данных в коде - это знакомые нам ссылки. Циклы и условные переходы - объекты действий с данными. Все можно описать с помощью связей и структур данных. Что и демонстрирует язык описания моделей UML , или Unified Modeling Language, — это унифицированный язык моделирования, описанный в стандарте ISO 19501. Все данные связаны между собой местом расположения в структуре объекта и семантическими связями, которые описывают влияние одних данных на другие. Связи могут описывать группировку данных, которая образует самостоятельный смысл. То есть смысл появляется, когда связи образуют некоторый порядок. Такой порядок связей иногда называют "почерком". В методике RMSL выделяют следующие структуры связей: агрегат, цепочка, иерархия. Агрегат связей был рассмотрен ранее и представляет соединение атрибутов в объект, например соединение столбцов в таблицу, когда в метаданных присутствуют БС (ID_object, ID_attr), у которых значение ID_object одинаковое, то есть все атрибуты принадлежат к одному и тому же объекту. Цепочка - структура БС (ID_object1, ID_object2), в которой ID_object2 предыдущей БС становится ID_object1 следующей в цепочке БС. Иерархия - это цепочка БС экземпляров одного и того же объекта.