Актуальный обзор современного статистического программного обеспечения, способного реализовать каждый из этих различных подходов, в зависимости от конкретного анализа интересующих их вопросов, исследовали Брейди Вест, Джоди Сакцауг и Гай Ален. Размышляя об альтернативных подходах и программных средствах их реализации, они рекомендуют учитывать цели данного анализа данных обследования.
Заинтересован ли человек лишь в том, чтобы сделать описательные выводы (средства, пропорции, итоговые показатели и т.д.), или он также заинтересован в достижении более "аналитических" целей (коэффициенты регрессии, коэффициенты вероятности и т.д.)?
Определение соответствующего программного обеспечения требует перекрестной классификации на "объективные" (описательные и аналитические) и "подходы" (на основе проектирования и моделирования). Так называемые "гибридные" подходы к аналитическим исследованиям сочетают в себе особенности как проектного, так и модельного подходов.
Современным специалистам по статистике обследований в целом необходимо владеть несколькими языками программирования, понимая все "за" и "против" каждого из них, а также эффективно использовать альтернативные программные средства для клиентов, желающих проанализировать данные обследований. Не все пакеты программного обеспечения имеют одинаковые возможности для анализа данных комплексных выборочных обследований.
Когда аналитики используют конструктивные подходы к описательному анализу данных обследования, их аналитические цели обычно включают в себя оценку простых описательных параметров, характеризующих конечную целевую совокупность, таких как средства, пропорции, итоговые значения, процентные доли строк или столбцов в таблицах непредвиденных обстоятельств, без учета проектирования (т.е. оценки, не имеющие отношения к используемой модели вероятности).
Эти подходы обычно включают взвешенную оценку интересующих параметров, а также непараметрическую оценку дисперсии выборки для взвешенных оценок и расчетов, скорректированных с учетом проектных параметров, в дополнение к конструктивно несмещенной непараметрической оценке дисперсии выборки для взвешенных оценок и испытаний ассоциаций между переменными.
Они широко применяются в различных пакетах статистического программного обеспечения и дают надежные демографические выводы, которые не требуют параметрических предположений в отношении интересующих переменных. В целом веса респондентов, рассчитанные организациями, занимающимися сбором и подготовкой данных обследования, учитывают три ключевых аспекта плана выборки и сбора данных:
- неравномерность вероятности отбора в выборку для различных элементов популяции,
- корректировка на отсутствие ответов при сборе данных,
- калибровка весов респондентов (возможно, скорректированных) по известным суммарным данным.
Первый элемент весомости респондента обычно называется расчетным весом. Проектный вес для данной включенной в выборку единицы определяется как обратный отношению к вероятности включения данной единицы в данную выборку, и эти расчетные веса могут быть рассчитаны для всех включенных в выборку единиц вероятностной выборки, включая респондентов и нереспондентов.
Выводы, сделанные на основе проектных подходов, обусловлены этими вероятностями выбора, и эти компоненты обеспечивают, чтобы оценки, рассчитанные с использованием весовых коэффициентов, надлежащим образом отражали вероятность выбора для конкретного случая из определенной обследуемой совокупности. При крайне необычном сценарии, когда 100 процентов включенных в выборку единиц совокупности отвечают на запрос о проведении обследования, можно рассчитать оценки обследуемых параметров совокупности, которые являются объективными по отношению к плану выборки, используя этот единый расчетный вес.
К сожалению, не все включенные в выборку единицы совокупности ответят на запрос о проведении обследования. Если не отвечающие единицы систематически отличаются от единиц-респондентов по ключевым представляющим интерес характеристикам, это может привести к смещению оценок, рассчитанных с использованием проектных подходов, в сторону отсутствия ответов.
По этой причине расчетные веса часто корректируются с учетом различий в отсутствии ответов между различными подгруппами населения, рассматривая вероятность реагирования как дополнительный стохастический этап отбора выборки, и умножая расчетные веса для единиц-респондентов на обратную вероятность ответа. Поскольку эти вероятности реагирования не известны на практике, их необходимо оценить.
Приведенные вспомогательные данные по респондентам и нереспондентам, которые в целом прогнозируют как вероятность получения ответов, так и основные переменные обследования в литературе даны подробные рекомендации по оптимальным методам оценки вероятности реагирования и их использованию для корректировки расчетных весовых коэффициентов для случаев отсутствия ответа. Следующим этапом расчета скорректированных проектных весов является калибровка весовых коэффициентов для единиц-респондентов на сумму известных итоговых показателей контроля численности населения, обеспечивая надежную представленность населения с точки зрения маргинального распределения характеристик населения.
Можно использовать различные подходы для выполнения калибровки на практике, включая постстратификацию, сгребание, и можно использовать различные подходы, включая постоянную регрессию, которая может использовать как для оценки численности населения в целом, так и в целом.
Окончательно откалиброванные веса затем могут быть скорректированы для минимизации влияния дисперсии веса на точность взвешенных оценок съемки. Весовые коэффициенты, полученные в результате этого процесса, должны быть введены аналитиками в процедуры программного обеспечения, позволяющие проводить точечную оценку параметров популяции без учета проектных отклонений.
Поскольку оценки склонности к ответу часто используются для корректировки расчетных весовых коэффициентов для единицы отсутствия ответа, эту неопределенность в окончательных весовых коэффициентах респондентов следует учитывать при оценке отклонений. Это лучше всего решать с помощью методов репликации, где процесс корректировки может повторяться для каждой репликационной выборки, а разница в корректировках между репликами включается в окончательные оценки отклонений.