マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

AIツール実験室

2023.08.29

【AIツール実験室】「GA4データ」からChatGPT「 Code Interpreter 」で「サイトレポート」を作ってみた!

【AIツール実験室】「GA4データ」からChatGPT「 Code Interpreter 」で「サイトレポート」を作ってみた!

はじめに

ごあいさつ

日本全国の「CodeInterpreterでレポートを楽ちんに作りたい勢」のみなさま、
おつかれさまです。

宇宙動画チャンネル

YouTubeチャンネルでの「スカイ三平」チャンネルは、
「宇宙に関する雑学」をいろいろ教えてくれる動画です。
9万人以上の登録者があり、
「ゆっくり霊夢」+「ゆっくり魔理沙」+「α」 のゆっくりキャラクター達が、
漫談であるかのように、宇宙のことを教えてくれます。
一般的な宇宙情報は当然のごとく、
宇宙時事ネタや、
ロケットエンジンのターボファンというパーツをじっくり紹介してくれるなど、
チャンネル主さんの宇宙知識がすごすぎであり、
ついつい見てしまいます。
650本以上の動画があるので、
「まだ知らなかった宇宙好き民」は、チェックしていただきたいと願う、
マジセミ担当者Aでございます。

→YouTube →スカイ三平

今回の作戦

前回の「Facebook ✕ Twitterクロス集計レポート」に続きまして・・・

Googleアナリティクスの新タイプ「GA4」のCSVデータを出力して、
ChatGPTプラグイン「 Code Interpreter 」に放り込んで、
サイトレポートを作成してみます。

前回までのあらすじ

→【ちょちょいと自動化DX】ChatGPT「 Code Interpreter 」で「Facebook ✕ Twitterクロス集計レポート」を作ってみた!

→【ChatGPTプラグイン探訪】「 Code Interpreter 」〜ファイル入出力+Pythonコード自動生成実行〜

ご注意点

※本記事は、担当者Aの主観により作成されていますので、なにとぞ、そういうことでよろしくお願いします。

※ChatGPTプラグインを利用するためは、「ChatGPT Plus」への課金が必要です。

※各プラグインの機能強化が進んでいる場合もありますので、最新情報をご確認ください。

「Code Interpreterに放り込んだCSV」は、漏洩してしまう可能性があります。『アナリティクスデータくらいなら、まあいいか』という覚悟が必要となります。

①GA4データ出力「Googleアナリティクスレポート」

概要

2023-07に、
Googleアナリティクスが「GA4」というものに変わってしまいました。

旧版と比較して、
なにやらインターフェースも変わってしまったようなので、
新たにレポートを作成して、CSVをダウンロードしてみます。

データの比較チェックができるように、
「2023-06の月間レポート作成」のためにレポートを作成します。

レポート作成

Googleアナリティクス →探索
で、
「空白」をクリックして、レポートを新規作成します。

レポート設定

「日付別」「ページ別」PV出力用の、
シンプルなレポートにしてみます。

シンプルレポートのスクショ

設定メモ

これだけのデータカラムがあれば、とりあえず、いけるんじゃないですかね。

設定項目 設定内容
カスタム(日付) 2022年7月1日~2023年6月30日
セグメント ※なし
ディメンション ・日付
・ページタイトル
・ページロケーション:ページURL
指標 ・表示回数
手法 ・自由形式
ビジュアリゼーション ・テーブル
セグメントの比較 ※なし
・ページタイトル
・ページロケーション
・日付
※なし
・表示回数
フィルタ 「ページロケーション」「先頭が一致」=「https://majisemi.com/topics/」
※フィルタ部分はそれぞれの環境に合わせてカスタマイズしてください。

データエクスポート

「データのエクスポート」ボタンを押して、
Googleスプレッド形式でエクスポートします。

データ確認

データ行数=数万行なので、うまく出ている感じです。

CSV出力

余計な部分を削除して、CSV出力します。

②グラフ作成(No.1)「月次PV推移グラフ」

月次PV推移グラフを出力します。

これはすんなり出てくれそうです。

プロンプト

■指示
「アップロードしたCSVファイル」(Googleアナリティクスデータ)から、
グラフを作成してください。

■期間フィルタ設定
・START=2022/07/01
・END=2023/06/30

■グラフ設定
・グラフ形式=折れ線グラフ
・グラフデータ=表示回数
・Y軸=表示回数
・X軸=年月 ※「YYYY-MM」表記
・グラフ内の表示は、すべて英語で出力

「Code Interpreter」の名前が変わっていた事件

「 Code Interpreter 」を実行してみようとしたところ、
いつのまにやら、
「 Code Interpreter 」が「Advanced Data Analysis」に変わっていることに気が付きました。

びっくりしてしまいますね。
表示名だけが変わったのでしょうかね。

実行結果

結果まとめ

さっくりと出ました。
よい感じですね。

扱うデータ量+データ項目数が少ないので、
SNSクロスレポートの時より、速く出てくる感じがします。

③グラフ作成(No.2)「月間コンテンツPVランキング」

こちらも、期間集計するだけなので、楽勝の気配です。

プロンプト

■指示
「アップロードしたCSVファイル」(Googleアナリティクスデータ)から、
グラフを作成してください。

■期間フィルタ設定
・START=2023/06/01
・END=2023/06/30

■出力設定
・出力形式=テーブル形式
・出力件数=10件

■出力項目
①ランク
  ※1からの連番
②ページタイトル
③ページロケーション
  ※クリックしたら該当ページが開くリンク にする
  ※「リンク」と表示
④表示回数

■ソート条件
④表示回数 降順

実行結果

結果まとめ

ランキングテーブルが出ました。

「リンク」をクリックすると、該当ページが開きます。

グッジョブですね。

④グラフ作成(No.3)「投稿後1週間PV」

こちらは、なかなか複雑な集計処理となります。
・期間フィルタ内に新規投稿された記事を対象とする
・新規投稿日から1週間のPVを集計

うまくいくでしょうか?

涙ぐましい試行錯誤の結果、なんとかプロンプトができました。

プロンプト

■指示
「アップロードしたCSVファイル」から、グラフを作成してください。

■CSVファイルのカラム名
・""ページ タイトル""
・""ページ ロケーション""
・""日付""
・""表示回数""

■カラム名修正
・""ページ タイトル""→""ページタイトル""
・""ページ ロケーション""→""ページロケーション""

■データ抽出条件
「ページロケーション」カラムにおいて、
URLが「https://majisemi.com/topics/[category]/」の形式で、
[category]が以下に該当するレコード
  ・tool
  ・automation-dx
  ・uncategorized
  ・chatgpt-plugin
  ・oss

■データ除外条件
「ページタイトル」カラムに「(not set)」のテキストが含まれるレコード

■データ準備「☆新規投稿日」
1.「ページタイトル」単位でサマリする
2.「ページタイトル」単位で「最小の日付」を「☆新規投稿日」として保存する。

■変数設定
・☆期間From=2023/06/01
・☆期間To=2023/06/30

■データ準備「☆該当ページタイトル」
「☆期間From <= ☆新規投稿日 <= ☆期間To」の条件に当てはまる「ページタイトル」のサマリを、
「☆該当ページタイトル」として保存する。

■データ集計条件 表示回数
「☆該当ページタイトル」単位において、
「☆新規投稿日」から「1週間の間」の「表示回数」を集計する。

■出力設定
・出力形式=テーブル形式
・出力件数=10件

■出力項目
①ランク
  ※1からの連番
②ページタイトル
  ※タイトルは省略せずに出力する
  ※【ちょちょいと自動化DX】などの共通テキストを削除しない
③表示回数
  ※整数表示

■ソート条件
③表示回数 降順

実行結果

結果まとめ

複雑な集計もなんとか成功!

集計結果は、だいたい合っているようです。

この種の集計処理は、既存ツールでも、なかなか難しいのではないでしょうかね?
無料でポチッとできちゃうツールがあったりするんですかね?

次月以降分は、このプロンプトで、(たぶん)楽ちんになれる予定であることを期待します。
「(旧名)Code Interpreter」に『よくできました!』と、ほめてあげたいと思います。

「ページタイトル」に「非公開」が混在している問題

「ページタイトル」に「非公開」が含まれてしまっている件については、
GA4が、そのように集計してしまっているようです。

公開後の「ページタイトル」と一緒に集計されているようであり、
除外できないので、
しょうがないですね。

さいごに

「Code Interpreter(旧名)でレポートを作ってみた!」シリーズは、
これにて、とりあえず、今のところは、
無事完了となりました。

「(新名)Advanced Data Analysis」は、
結構、賢い子なので、
みなさんも使ってみてあげてください。

【お知らせ】記事リストポータルページ

こちらの記事リストポータルページでは、
【ChatGPTプラグイン探訪】および【ちょちょいと自動化DX】の記事一覧を参照できます。

→記事リストポータルページ

【お知らせ】「マジセミ」のご紹介

「マジセミ」では、日々、多くのIT関連セミナーを開催しています。

多くのセミナーの中から「ご自身のスキルやビジネスを強化できるセミナー」を見つけて、ぜひ1度、参加してみてください。

マジセミのイメージロゴ

マジセミ関連プラットフォーム

プラットフォーム 説明 URL
マジセミ マジセミで実施されるさまざまなセミナーの開催情報を確認できます。
「IT関連セミナー」「製造業関連セミナー」など、ご自身のビジネスを強化できるセミナーを検索できます。
→majisemi.com
マジセミサービス 「セミナーを開催したい方」向けの情報を確認できます。
トライアルからの利用が可能です。
→majisemi.com →service
マジセミドライブ 「IT関連コンテンツ」などを紹介しています。 →majisemi.com
→topics
マジセミFacebook 毎日「マジセミ関連情報」や「IT関連ニュース」などを紹介しています。
★フォローお願いします。
→facebook.com
→OSSNews
マジセミTwitter マジセミFacebookと同様に、
毎日「マジセミ関連情報」や「IT関連ニュース」などを紹介しています。
★フォローお願いします。
→twitter.com
→Majisemi_it

※「ご意見」「ご感想」「誤字がありましたよ」「こんな使い方もあるみたいですよ」などありましたら、
マジセミSNS(Facebook or Twitter)まで、お知らせください。

おすすめの記事

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

「 VMWare 」の仮想化技術は、「ITインフラの効率化」に大きく貢献する技術ですが、Broadcomによる買収後のライセンス変更が大きな問題として注目されています。柔軟で慎重な契約見直しが今後の鍵となります。

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

「 2029年問題 」とは、高校でのデジタル教育改革により、新入社員と既存社員間でデジタルスキル格差が拡大する懸念を指します。企業は早急に対応が求められています。この格差は、企業競争力や業務効率にも、影響を及ぼす可能性があります。

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

経済産業省による「 生成AI 利活用ガイドブック 」は、企業やクリエイター向けに、安心して「生成AI」を利用するための、「指針」「実例」「注意点」を明示しています。「業務効率化」や「新しいアイデア創出」の支援を目的としています。