Отсутствующие сегменты данных являются основной причиной ошибок и потери данных при высокоточном и изменяющемся по времени сборе критических данных. Потеря передачи данных, внешние помехи или плохое разрешение сенсорного оборудования являются основными причинами, ведущими к передаче данных в отсутствующие сегменты данных. Получение исходных данных в указанных выше ситуациях практически невозможно.
Следовательно, следует полагаться на методы оценки данных, особенно в приложениях, где существуют изменяющиеся условия динамического времени и потерянные данные не могут быть восполнены или повторно получены. В большинстве случаев единственным решением для отсутствующих сегментов данных является игнорирование этих данных полностью и опора на новый набор данных. Анализ, основанный на таких данных, может вводить в заблуждение и даже скрывать скрытые дефекты и изменения.
Проблема отсутствующих сегментов данных может возникать в разных случаях.
В большинстве случаев измеренные данные могут быть потеряны при передаче, и поэтому информация по определенным фрагментам не будет получена вовремя, что приведет к отсутствию сегментов измеренных данных. С другой стороны, может возникнуть ситуация, когда измеренные данные настолько повреждены шумом в определенных сегментах, что исследователь или аналитик решит отклонить эти значения, что это приведет к отсутствию данных. В обоих случаях задача легко решается для инвариантных по времени линейных систем с помощью нового набора измеренных данных или экстраполяции значений стационарного состояния на отсутствие сегментов данных измеренных данных.
Однако в случае нелинейной системы оценка недостающих данных путем экстраполяции значений устойчивого состояния приемлема только в том случае, если система находится в устойчивом состоянии, а отсутствующие данные относятся к периоду времени, в течение которого система находится в устойчивом состоянии. Что касается стохастических по своей природе линейных или нелинейных систем с переменным временем, то значения данных по отсутствующим сегментам данных не могут быть экстраполированы. Экстраполяция приведет лишь к ошибочному или вводящему в заблуждение прогнозированию поведения системы.
Одна из самых ранних попыток оценить недостающие сегменты данных была предпринята в качестве метода множественной интерполяции.
Также известная как MI, эта процедура делит измеренные данные на небольшие подмножества одинаковой длины. Тогда недостающие точки данных являются вмененными значениями из их предыдущих доступных данных измерений. Этот метод получил широкое признание, в котором они расширили метод MI, включив в него случаи с ошибкой измерения, рассматривая его как особый случай проблемы с отсутствующими данными.
Оценка недостающих значений данных с использованием метода минимальной средней квадратной погрешности предполагает наличие условий устойчивого состояния и нулевого шума при измерениях. Это простой и понятный метод для инвариантных по времени систем.
Метод скользящего среднего фильтра представляет собой простой метод для приложений, использующих системы с линейным изменением времени, подверженные влиянию отсутствия сегментных данных.
Для динамически изменяющейся системы отсутствия сегментных данных может быть оценена с помощью геометрического скользящего среднего окна или прямоугольного фильтра скользящего окна. Учеными было отмечено, что отфильтрованная оценка ошибочна из-за большого размера отсутствия сегментных данных. Такой подход фильтрации был основан на применении алгоритмов сглаживания.
Определение подходящей модели для описания динамики процесса очень важно.
Представленная методика оценки на основе модели использует модель, идентифицированную для данного процесса с использованием системного подхода к идентификации. Преимущества данного подхода заключаются в его минимальных допущениях и объективных оценках. В оценке модели на основе системной идентификации используется метод наименьших квадратов для обеспечения объективности, оценок коэффициентов модели. Этот подход также привлекателен благодаря своей общей расширяемости до линейных и нелинейных инвариантных и стохастических систем времени.
В зависимости от характеристик системы могут быть определены различные структуры модели.
Лучше всего моделировать инвариантную систему с линейной стабильностью времени можно с помощью простой модели передаточной функции. Нелинейная инвариантная стабильная модель времени лучше всего моделируется авто регрессионной моделью. Авто регрессионная модель имеет авто регрессионный экзогенный термин для модели процесса и модель аддитивного белого шума.
Для идентификации модели используется известная измеренная краткосрочная динамика, подмножество входных и исходных данных процесса, не содержащее отсутствия сегмента данных. Здесь нелинейная структура авто регрессионной модели выбирается в соответствии с системной динамикой, так как она нелинейна и инвариантна по времени с устойчивыми условиями состояния.