隅歩つ

書いて理解を深める

Google AnalyticsのAPIを使ってみる

Python の Pandas の勉強をする時、書籍などについているサンプルデータを使うことが多いのですが、自分にとって身近なデータを使う方が楽しいだろうな、とよく思う。

自分のブログのアクセスデータだったら、思い入れもあるから数字の 1 つに 1 つにいろいろ感じることがあるんじゃないかと思い、Google Analytics のデータを使うことにしました。

Google Analytics のデータは API を使ってみることにしました。
API を使ってみたかったのもあるので一石二鳥です。

参考にしたもの

参考にしたのは Google アナリティクス公式です。

はじめてのアナリティクス Reporting API v4: サービス アカウント向け Python クイックスタート

developers.google.com

v4 ってあるから GA4 対応と思っていたけど関係ないらしい、、、ややこしい。。

ちょうどこの Python クイックスタートを使った記事もありました。

こちらも参考にさせていただきました。

reffect.co.jp

Google アナリティクス API の種類

Google アナリティクスの API はいろんな種類があるようです。

調べたら API がいろいろあって迷いました。

学習ページに全体像の図がありました。

developers.google.com

Repoting API は Reporting の Core Repoting API のようです。

必要な手順

  • Reporting API の有効化
  • 認証情報
  • サービスアカウント
  • json (client_secrets.json)
  • Google Analytics4 のビューにユーザー追加
  • pip でインストール(pip install --upgrade google-api-python-client)

サンプルコード

クイックスタートにある以下のサンプルコードを実行します。

developers.google.com

from apiclient.discovery import build
from oauth2client.service_account import ServiceAccountCredentials

SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = 'client_secrets.json'
VIEW_ID = 'アナリティクス設定画面のビューIDを入れる'


def initialize_analyticsreporting():
    credentials = ServiceAccountCredentials.from_json_keyfile_name(
        KEY_FILE_LOCATION, SCOPES)

    analytics = build('analyticsreporting', 'v4', credentials=credentials)

    return analytics


def get_report(analytics):
    return analytics.reports().batchGet(
        body={
            'reportRequests': [
                {
                    'viewId': VIEW_ID,
                    'dateRanges': [{'startDate': '7daysAgo', 'endDate': 'today'}],
                    'metrics': [{'expression': 'ga:sessions'}],
                    'dimensions': [{'name': 'ga:country'}]
                }]
        }
    ).execute()


def print_response(response):
    for report in response.get('reports', []):
        columnHeader = report.get('columnHeader', {})
        dimensionHeaders = columnHeader.get('dimensions', [])
        metricHeaders = columnHeader.get(
            'metricHeader', {}).get('metricHeaderEntries', [])

        for row in report.get('data', {}).get('rows', []):
            dimensions = row.get('dimensions', [])
            dateRangeValues = row.get('metrics', [])

            for header, dimension in zip(dimensionHeaders, dimensions):
                print(header + ': ' + dimension)

            for i, values in enumerate(dateRangeValues):
                print('Date range: ' + str(i))
                for metricHeader, value in zip(metricHeaders, values.get('values')):
                    print(metricHeader.get('name') + ': ' + value)


def main():
    analytics = initialize_analyticsreporting()
    response = get_report(analytics)
    print_response(response)


if __name__ == '__main__':
    main()

これを実行すると、以下のようになります。

ga:country: Japan
Date range: 0
ga:sessions: 9

1週間のセッション合計とアクセスがきた国がわかります。

セッション数が少ないので、まだ分析できそうにありません。。。