Добавить в корзинуПозвонить
Найти в Дзене
Population and Economics

Прогнозирование рождаемости в России на основе статистики поисковых запросов Google Trends

Авторы: Лилия А. Родионова, Елена Д. Копнова, Светлана C. Камалендинова, Никита А. Родионов Статья опубликована в номере 10 (2) за 2026 год В статье предложен подход к прогнозированию рождаемости с использованием статистики поисковых запросов Google Trends. В отличие от существующих исследований по прогнозированию рождаемости в работе предложена методика агрегирования тематических поисковых запросов на основе методов машинного обучения, снижения множества поисковых запросов с помощью метода главных компонент, а также введена лаговая структура поисковых запросов 1-12 месяцев в зависимости от тематики поиска. Глубина лага определялась на основе кросс-корреляционной функции, сравнения информационных критериев и значимости соответствующих коэффициентов в модели SARIMAX. В работе использовались данные Росстата помесячной динамики числа зарегистрированных родившихся за период с января 2011 г. по декабрь 2024 г. Результаты показали, что модель прогнозирования рождаемости на основе SARIMAX с у

Авторы: Лилия А. Родионова, Елена Д. Копнова, Светлана C. Камалендинова, Никита А. Родионов

Статья опубликована в номере 10 (2) за 2026 год

В статье предложен подход к прогнозированию рождаемости с использованием статистики поисковых запросов Google Trends. В отличие от существующих исследований по прогнозированию рождаемости в работе предложена методика агрегирования тематических поисковых запросов на основе методов машинного обучения, снижения множества поисковых запросов с помощью метода главных компонент, а также введена лаговая структура поисковых запросов 1-12 месяцев в зависимости от тематики поиска. Глубина лага определялась на основе кросс-корреляционной функции, сравнения информационных критериев и значимости соответствующих коэффициентов в модели SARIMAX.

В работе использовались данные Росстата помесячной динамики числа зарегистрированных родившихся за период с января 2011 г. по декабрь 2024 г. Результаты показали, что модель прогнозирования рождаемости на основе SARIMAX с учетом статистики поисковых запросов и их лаговой структуры улучшает характеристики качества прогноза. Лучшей моделью прогнозирования на 1 год оказалась модель с запросами «Подготовка к родам» и их лагами, на 2 и 3 года – «Все запросы».

В качестве метрик качества использовались метрики MAPE, MAE. Для проверки устойчивости метрик дополнительно была проведена процедура кросс-валидации с расширяющимся и скользящим окном.

--

Подробнее по ссылке: https://doi.org/10.3897/popecon.10.e169776

Статья опубликована на русском и английском языках.

--

Публикация в журнале Population and Economics осуществляется бесплатно благодаря поддержке «АКБ «Держава» ПАО» и Экономического факультета МГУ имени М. В. Ломоносова.

#population_and_economics #fertility #forecasting