Найти тему

Метаданность

"Больше данных хороших и разных! Много данных не бывает!", - похожие высказывания встречаются довольно часто. Их появление можно понять. Если для решения задачи НЕТ данных - нужно искать и собирать всё, что хотя бы как-то поможет решению. В таком случае это оправдано. Обратная ситуация - данных ОЧЕНЬ много, а как их применять - неизвестно. Здесь на помощь приходят метаданные. Это данные о том, как использовать данные. Или данные о данных. Полезность самих метаданных заключается в том, что они дают возможность использования исходных данных с целью извлечения из них полезности (добыча знаний). Образно выражаясь, если лопата - это данные, то инструкция по ее применению - метаданные. Существуют разные виды лопат - штыковая, совковая, заступ, для снега,... В каких случаях и как эффективно использовать конкретный вид лопаты (полезность) - тоже метаданные. В самом широком смысле онтология предметной области - отобранные и структурированные для этой области метаданные. Метаданные сильно упрощают и ускоряют работу с данными. Самый простой пример - разметка текстов и документов (форма хранения данных) тегами. При грамотном применении поиск данных по тегам в разы эффективнее полнотекстового поиска. Тоже самое касается онтологии. При ее наличии поиск нужных материалов займет гораздо меньше времени, чем перебор ВСЕХ документов, потенциально содержащих полезные данные. Для иллюстрации можно привести поиск книги в большой библиотеке. Можно долго бродить вдоль книжных полок, высматривая на корешках нужное название. А можно воспользоваться книжной картотекой (онтология книг данной библиотеки).

Конечно, отбор и упорядочивание метаданных требуют затрат. Но эти затраты себя многократно оправдывают при регулярном использовании метаданных. Другими словами, если для вас данная предметная область регулярная деятельность - стоит вложиться в подготовку метаданных. Если речь идет о разовом запросе - проще использовать контекстный поиск.