Статья по экспорту данных из API Яндекс Метрики в pandas DataFrame по ссылке.
Что понадобится:
- Включенный API Google Analytics;
- Доступ к панели администратора на аккаунте Google Analytics;
Включаем API Google Analytics
- Переходим в сервис Google API Console по адресу https://console.developers.google.com/apis/dashboard.
- В левой колонке выбираем раздел «Учетные данные».
3. Выбираем «Создать учетные данные» — «Мастер создания учетных данных».
4. В блоке «Какой API вы используете?» выбираем «Analytics Reporting Api».
4.1. Если варианта «Analytics Reporting Api» нет, выбираем «Другие API», нажимаем «Открыть библиотеку API» и ищем в каталоге «Analytics Reporting Api».
5. В блоке «Откуда вы будете вызывать API» выбираем вариант «Другое, без интерфейса пользователя». В Ставим галочку напротив пункта «Данные приложения». И еще одну галочку в блоке «Планируется ли использовать этот API для App Engine или Compute Engine?» напротив варианта «Нет, не использую».
6. В поле «Название сервисного аккаунта» вводим любое название. В блоке «Роль» выбираем «Проект» — «Владелец». Тип ключа «JSON».
7. После нажатия кнопки «Продолжить» сервис предложит скачать файл с данными для авторизации.
8. Полученный файл надо «залить» в папку на google drive.
Авторизуем API аккаунт в Google Analytics
В скачанном ранее файле (можно открыть текстовым редактором) хранится словарь с данными для авторизации. Берем email из строки «client_email» и предоставляем ему доступ к аккаунту нужного счетчика google analtics.
Для этого:
- В левой колонке выбираем раздел «Администратор».
3. В блоке «Аккаунт» выбираем пункт «Управление доступом».
4. Нажимаем «Добавить пользователя» и добавляем email.
Настраиваем jupyter / colab
Следующие шаги опишу на примере google colab, но они будут справедливы и для пользователей jupyter notebooks.
- Устанавливаем модуль gaapi4py. В colab для этого достаточно будет указать стандартный pip install gaapi4py, добавив в начале восклицательный знак:
!pip install gaapi4py.
2. Подключаем модули:
from gaapi4py import GAClient
import pandas as pd
from os.path import join
from google.colab import drive
3. Монтируем root google drive.
ROOT = “/content/drive”
drive.mount(ROOT)
После запуска появится ссылка, перейдя по которой можно получить код авторизации. Берем полученный код и вставляем в соответствующее поле.
4. Указываем путь к сервисному ключу.
5. Формируем тело запроса.
Список параметров и показателей (dimensions & metrics) можно посмотреть в справке google по ссылке.
На выходе мы получаем:
- response[‘info’] — мета-информация,
- response[‘data’] — pandas. DataFrame.
Пример полученного отчета:
Тетрадка colab на Github
Ссылка на тетрадку.