Найти тему
In Data We Trust

Экспорт данных из Google Analytics в pandas по API

Оглавление

Статья по экспорту данных из API Яндекс Метрики в pandas DataFrame по ссылке.

Что понадобится:

  • Включенный API Google Analytics;
  • Доступ к панели администратора на аккаунте Google Analytics;
  • Установленный jupyter notebooks или google colab ;
  • Модуль gaapi4py.

Включаем API Google Analytics

  1. Переходим в сервис Google API Console по адресу https://console.developers.google.com/apis/dashboard.
  2. В левой колонке выбираем раздел «Учетные данные».

3. Выбираем «Создать учетные данные» — «Мастер создания учетных данных».

-2

4. В блоке «Какой API вы используете?» выбираем «Analytics Reporting Api».

4.1. Если варианта «Analytics Reporting Api» нет, выбираем «Другие API», нажимаем «Открыть библиотеку API» и ищем в каталоге «Analytics Reporting Api».

-3

5. В блоке «Откуда вы будете вызывать API» выбираем вариант «Другое, без интерфейса пользователя». В Ставим галочку напротив пункта «Данные приложения». И еще одну галочку в блоке «Планируется ли использовать этот API для App Engine или Compute Engine?» напротив варианта «Нет, не использую».

-4

6. В поле «Название сервисного аккаунта» вводим любое название. В блоке «Роль» выбираем «Проект» — «Владелец». Тип ключа «JSON».

-5

7. После нажатия кнопки «Продолжить» сервис предложит скачать файл с данными для авторизации.

8. Полученный файл надо «залить» в папку на google drive.

Авторизуем API аккаунт в Google Analytics

В скачанном ранее файле (можно открыть текстовым редактором) хранится словарь с данными для авторизации. Берем email из строки «client_email» и предоставляем ему доступ к аккаунту нужного счетчика google analtics.

-6

Для этого:

  1. Переходим в сервис Google Analytics по адресу https://analytics.google.com/analytics/.
  2. В левой колонке выбираем раздел «Администратор».
-7

3. В блоке «Аккаунт» выбираем пункт «Управление доступом».

-8

4. Нажимаем «Добавить пользователя» и добавляем email.

-9

Настраиваем jupyter / colab

Следующие шаги опишу на примере google colab, но они будут справедливы и для пользователей jupyter notebooks.

  1. Устанавливаем модуль gaapi4py. В colab для этого достаточно будет указать стандартный pip install gaapi4py, добавив в начале восклицательный знак:

!pip install gaapi4py.

-10

2. Подключаем модули:

from gaapi4py import GAClient
import pandas as pd
from os.path import join
from google.colab import drive

3. Монтируем root google drive.

ROOT = “/content/drive”
drive.mount(ROOT)

После запуска появится ссылка, перейдя по которой можно получить код авторизации. Берем полученный код и вставляем в соответствующее поле.

-11

4. Указываем путь к сервисному ключу.

5. Формируем тело запроса.

Список параметров и показателей (dimensions & metrics) можно посмотреть в справке google по ссылке.

На выходе мы получаем:

  • response[‘info’] — мета-информация,
  • response[‘data’] — pandas. DataFrame.

Пример полученного отчета:

-12

Тетрадка colab на Github

Ссылка на тетрадку.

-13