Представленный материал имеет узкую специфику и аудиторию. Материал не претендует на полноту и истинность и является переработанными материалом собственного толкования. Материал защищен Законом об авторском и смежных правах, любое использование свободное с обязательным указанием источника.
В предыдущей публикации предлагался механизм просмотра LAS файлов.
В этой публикации опишу механизм получения приближения (аппроксимации) при анализе функциональной зависимости геофизических параметров. Понимание этого механизма позволит более глубоко понимать предложенную систему выделения геофизических аномалий, а также подход к выделению аномалий более высокого порядка. Сам по себе механизм ещё недостаточно изучен и требует своих героев.
Для начала необходимо понимать для чего нужно приближение (усреднение). Если посмотреть на геофизическую кривую, то становится очевидно, что рассматриваемый параметр имеет некоторую дискретную девиацию, разброс параметра. Однако подавляющее большинство параметров не меняются дискретно, и их можно описать некоторой функциональной кривой. И процесс приближения направлен на приближение дискретно изменяющихся значений к функциональной кривой (но не только).
Рассмотрим несколько механизмов получения приближения. Некоторые механизмы были опробованы, их краткая характеристика использования в данных условиях будет описана.
Линейное приближение.
Реализация метода линейного приближения будет сводиться к определению среднего арифметического относительно основного замера с регулируемой шириной окна скольжения приближения. Т.е. количества элементов участвующих в усреднении значения. Схематически механизм представлен на рисунке. Стоить заметить, что именно самый простой механизм приближения дал лучшие результаты.
Общая схема механизма представлена на рисунке ниже.
В зависимости от "ширины окна" значений которые будут попадать в определение среднего арифметического будет меняться форма кривой описывающей приближение. На рисунке ниже приведены несколько вариантов кривых при ширине окна приближения в 7, 15, 31 и 63 элемента. Красная кривая - исходные значения, зеленая - линейное приближение.
Таким образом. чем больше элементов попадает в приближение тем "хуже" кривая описывает исходные значения, но имеет намного меньше локальных экстремумов.
Скользящая медиана (скользящее среднее).
Медиана – среднее по счету значение в упорядоченном массиве. Т.е. берётся окно, скользящее по указанному диапазону, в этом окне упорядочиваются данные, например по возрастанию, или по убыванию, это не принципиально. После этого определяется средний элемент по номеру, он и будет результатом приближения. В виду простоты понимания термина скользящая медиана, схематическое изображение метода считаю лишним. На рисунке ниже зеленая кривая - линейное приближение, оранжевая - скользящая медиана.
Можно наблюдать, что оранжевая кривая по сравнению с зеленой кривой, имеет выраженную дискретность и особенность изменений параметра в виде «клыков» в зонах изменений характеристики типа подъём/спад. Приближение скользящей медианы сильно «режет» выпады, и может ограничить идентификацию «реального» выпада, особенно когда ширина окна скольжения достаточно велика. Учитывая и тот факт что эффект «ступенька» очень выражен, сам по себе метод скользящей медианы не даёт хороших результатов, разве что в комплексе с другими методами а-ка полосовой фильтр. Но это ещё предстоит выяснить и опробовать.
Нелинейное приближение.
Реализация алгоритма нелинейного приближения оказалась увлекательной задачей. В сети на форумах доступного алгоритма не наблюдалось, а в разделах прикладной математики предлагались фиксированные коэффициенты (время показало что плохо искал). Задача же сводилась к тому, что чем дальше данные от «центра» тем меньше их «вес» и влияние на усреднение. При этом должно быть достаточно просто рассчитать «вес», в зависимости от ширины окна приближения. За основу была принята функция F=1/X. Где в качестве X выступает расстояние от «центрального» элемента.
Т.е. чем дальше, тем меньше функция, которая будет отождествлять коэффициент «веса». Теперь необходимо «привести» сумму коэффициентов к общему целому числу. Т.е. при любой ширине окна приближения сумма коэффициентов «веса» должна быть целым числом, например единицей. Тогда общая формула для расчета будет выглядеть как сумма элементов умноженных на коэффициенты «выше по оси» плюс центральное значение и плюс сумма элементов умноженных на коэффициенты «ниже по оси» и все это деленное на три. Таким образом, рассчитывается весь диапазон с механизмом границ как и в линейном приближении.
Детальное изучение методик показало, что этот метод называется "метод обратных расстояний".
Общая модель нелинейного приближения изображена на рисунке ниже.
Если быстро сравнить два метода, линейное и нелинейное приближение, то смотря на картинку ниже можно сделать вывод...
Не трудно заметить, что синяя кривая нелинейного приближения более четко повторяет оригинальную кривую. Однако со всеми плюсами есть и минусы, «шум», всплески, и другие краткие изменения сильно влияют на общую картину, т.к. вес «центрального» элемента (относительно которого идёт приближение) имеет доминирующее значение.
Таким образом лучшим из рассмотренных методов оказался метод линейного приближения. Однако на этом исследования не окончены и планируется опробовать и синтезировать другие методы и подходы о чем будут соответствующие статьи.
Реальное использование приближений использовано и описано в методе градиентной подсветки.