Начинающим учёным, горящим энтузиазмом исследовать какую-то тему, иногда приходится слышать от руководителей фразу «это, конечно, очень интересно, но данных вы не найдете». И хорошо, когда о недостатке данных мы узнаем сразу, а не через несколько лет научных поисков. Поэтому задаться вопросом «где брать данные?» необходимо сразу же при формулировке темы исследования. Рассмотрим основные направления поисков, их преимущества и недостатки.
Официальная статистика
Самый «стопроцентный» источник данных, поскольку даже если мы понимаем, что в применяемых официальными органами методиках сбора данных и обработки показателей есть некоторые недостатки, эти данные никто оспаривать не будет. Как правило, вполне работоспособен аргумент «ну, других данных по данному вопросу в официальных источниках нет». В основном это данные Росстата (gks.ru), Банка России (https://cbr.ru/statistics/) и других министерств и ведомств.
Преимущества:
- официальный источник;
- низкая вероятность, что рецензенты и оппоненты поспорят с выбором источника;
- как правило, повторяемость во времени (наличие рядов динамики показателей);
- возможность найти методику, по которой показатели получены.
Недостатки:
- не все данные, которые могут потребоваться, присутствуют в официальной статистике. Или могут отсутствовать некоторые разрезы. Например, по России в целом есть данные по здравоохранению, а в разрезе регионов их найти очень проблематично.
- запаздывание публикации. Данные за прошлый год публикуются, как правило, в середине следующего года, а в ряде случаев и позже. Поэтому исследования будут с запаздыванием минимум на год для большинства показателей.
- иногда происходит смена методики расчета без приведения данных в сопоставимый вид. Например, после принятия ОКВЭД2 в 2017 году возникла проблема с сопоставимостью данных по видам деятельности.
- внезапное прекращение расчета показателей или публикации сборника, в котором публиковался нужный показатель. Например, Ростовстат прекратил в 2021 году публикацию большого сборника «Россия в цифрах», успешно публиковавшегося более 20 лет. А только там мне удалось найти данные о величине инвестиций (нефинансовых и финансовых вложений) в рублях (в разделе «инвестиции» на сайте – только структура, проценты). Это означает, что данные начиная с 2021 года, которые публиковались только в этом сборники, будут недоступны далее.
- если мы используем официальные данные регионального министерства или ведомства, то все становится еще менее предсказуемым.
Опрос
Широко используемый источник данных, потому что даже если нет официальной статистики, мы всегда можем спросить мнение людей. Может применяться экономистами, финансистами, психологами, социологами, медиками – специалистами практически любого профиля.
Достоинства:
- можно использовать в большом количестве случаев,
- можно получить данные практически по любой теме исследования,
- опросник может быть любой сложности и длины (в принципе).
Недостатки:
- для получения хорошего результата нужно очень тщательно составлять анкету (это крайне непросто, это отдельное умение, требующее и знаний, и опыта),
- если анкета длинная, достоверность ответов будет падать по мере усталости респондента,
- репрезентативности скорее всего добиться не получится, т.к. это требует соблюдения определенных трудоемких процедур, которые чаще всего невозможны в рамках исследования без дополнительного финансирования,
- опросить нужно «много» человек (в идеале, необходимо рассчитывать необходимую численность выборки),
- для научной достоверности нужно будет тщательно описать способ формирования выборки.
Репрезентативные опросы
Это опросы, которые до нас провели серьезные организации и предоставили их результаты для общего доступа. Для России в настоящее время есть два источника таких данных.
1. Российский мониторинг экономического положения и здоровья населения НИУ ВШЭ (RLMS HSE)», проводимый Национальным исследовательским университетом "Высшая школа экономики" и ООО «Демоскоп» при участии Центра народонаселения Университета Северной Каролины в Чапел Хилле и Института социологии Федерального научно-исследовательского социологического центра РАН. (Сайты обследования RLMS HSE: http://www.hse.ru/rlms и https://rlms-hse.cpc.unc.edu)».
Достоинства:
- бесплатный доступ после несложной регистрации,
- репрезентативный для России опрос,
- панельные данные (если они требуются),
- широкий спектр вопросов,
- описание методики сбора данных.
Особенности (поскольку недостатков как таковых у него нет):
- Вам необходимо уметь работать в пакете SPSS (данные предоставляются именно в нем),
- необходимо проверить, есть ли в анкете вопросы, необходимые для Вашего исследования.
2. Опросы Росстата. Их можно найти, если на официальном сайте gks.ru выбрать пункт «Переписи и обследования», нажать «узнать больше», и выбрать вариант «Федеральные статистические наблюдения по социально-демографическим проблемам».
Достоинства:
- репрезентативность,
- описание методики,
- повторяемость по годам (для некоторых обследований).
Недостатки:
- не для всех обследований есть возможность получить файлы данных для расчетов (например, есть для «Комплексного наблюдения условий жизни населения», нет для «Выборочного наблюдения доходов населения и участия в социальных программах», а для «Выборочного наблюдения репродуктивных планов населения» есть только возможность получить обобщенные итоги в определенных срезах),
- ограниченный перечень наблюдений, может не оказаться нужных Вам, либо там не будет нужных вопросов.
Экспертный опрос
Это тоже опрос, но опрашиваете вы не людей относительно самих себя, как в обычном опросе, а экспертов по поводу интересующей вас проблемы в той области, в которой они являются экспертами.
Достоинства:
- можно использовать для исследования практически любой области,
- можно опрашивать значительно меньше людей, чем при обычном опросе.
Особенности:
- необходимо строго соблюдать процедуру экспертного опроса, иначе результат будет некачественным,
- важно качественно составить анкету.
Недостатки:
- могут быть проблемы с подбором экспертов,
- речи о репрезентативности не идет, и другая группа экспертов может дать иной результат.
Вывод
Независимо от того, где мы возьмем данные для исследования, важно удостовериться в том, что они соответствуют двум основным требованиям:
- достоверности;
- сопоставимости.
А также выбрать корректную схему анализа и статистический инструментарий. Об этом поговорим в следующих статьях.