GA4レポートの落とし穴 ”サンプリング”に要注意!

GA4レポートの落とし穴 ”サンプリング”に要注意!

みなさんは「サンプリング」という言葉を聞いたことはありますか?
Google アナリティクス 4 プロパティ (以下GA4) においてサンプリングとは、大量のデータを処理するために使用する手法として知られています。しかし、より正確なレポートを抽出し、データ分析をするためには注意が必要です。
今回は、GA4でサンプリングされるレポートの種類と、回避方法についてご紹介します!

GA4の「サンプリング」とは?

サンプリングとは、大量のデータを処理するために使用される手法で、一部のデータから、全体を予測することです。

この一部のデータが占める割合のことを「サンプリングレート」と呼びます。このサンプリングレートの割合によって、レポートの精度が変わります。

例えば、サンプリングレートが50%の場合は、全てのデータの中から半分だけを対象にして残りの半分を推測して分析を行うことになります。

サンプリングレートが高いほど、分析対象となるデータが多くなり、レポートの精度が高くなります。

効果的なデータ活用には、より正確なデータを使ったデータ分析が必要になるため、サンプリングレートをできるだけ高くする、もしくはサンプリングされることを回避することが重要です

 

処理するイベント数がクエリごとに1,000万イベントを超えるとサンプリングが発生する

GA4では、レポートの種類に関わらず、クエリごとに1,000万イベントを超えると、サンプリングが発生します。
Eコマースサイトやゲームサイト、メディアサイト、SNSなど、高いトラフィックを持つサイトは、1,000万イベントを超える可能性があるため特に注意が必要です。

 

サンプリングが発生しているか確認する方法

それでは、GA4でサンプリングが発生しているか、確認をしてみましょう。
左ナビゲーションから「探索レポート」をクリックし、任意の探索レポートを作成します。

360_1-2

画面右上の「!」アイコンにカーソルを当て、「サンプリング率の高いデータ」と表示される場合、サンプリングが発生しています。
以下の方法でサンプリングの回避が必要です。

サンプリングを回避する3つの方法

それではサンプリングを回避するにはどうしたら良いのでしょうか?
サンプリングを回避する3つの方法についてご紹介します。

方法1
GA4 有料版にアップグレードし、サンプリングが発生するイベント上限を緩和、さらに探索レポートの「精度の高い結果」を選択する

GA4には、様々な機能が使えるようになる有料版があります。
無料版のGA4では、クエリごとに1,000万イベントでサンプリングが発生しますが、有料版のGA4では、上限数が10億イベントに大幅アップします。
サンプリングを回避するためには、アップグレードに加え、以下の設定が必要です。
探索レポートの右上にある「データ品質アイコン360_1-3」をクリックし、プルダウンから「精度の高い結果」を忘れずに選択しましょう。
これにより、サンプリングの影響を最小限に抑えることができます。

360_1-4
迅速な結果(デフォルトの設定):

より小規模なサンプルサイズ(1 億イベント)を使用して、速やかに結果を得られます。
こちらがデフォルトの設定となっています。

360_1-5

精度の高い結果:

最大限のサンプルサイズ(10 億イベント程度)を使用して、データセットの全容を正確に反映した結果を得られます。
「精度の高い結果」を選択し、「このレポートは、利用可能なデータの100.0%に基づいています。」と表示された場合、サンプリングが発生していないことになります。
ただし、データが表示されるまで、数十秒程度の時間がかかることをご留意ください。
※追記:2023年2月20日

また、有料版にすることにより、今回ご紹介した「サンプリングの回避」だけでなく、「データ保持期間の延長」や「(Other)の表示回避」「データセットの設定エラーの解消」「サブプロパティの作成」「Google広告連携におけるオーディエンス作成上限の緩和」「BigQueryへのエクスポートの上限緩和」「収集できるイベント上限の緩和」など、様々なメリットがあります。

サービス紹介はこちら

方法2
期間で「日付」を絞り込む

日付の絞り込みを行うことで、分析対象のデータ量を減らすことができ、サンプリングの影響を最小限に抑えることができます。

方法3
BigQueryにエクスポートして分析する

BigQueryとGA4を連携して直接エクスポートすることによって、サンプリング前のデータを活用できます。
ただし、BigQueryにエクスポートしたデータを抽出するためにはGA4のデータセットの知識とともに、SQLの知識も必要になります。
また、Googleシグナル由来のデータは含まれないことに加えて、GA4のユーザー数は統計を元に算出(2%程度の誤差が発生)しているため、GA4のレポートとユーザー数やセッション数が異なる場合があります。
また、無料版のBigQueryエクスポートには、上限設定があり、1日あたり100万イベントまでとなります。

サンプリングを回避するなら有料版のGA4がおすすめ

このようにサンプリングを回避するには、様々な方法があります。
ただし、今後継続的にデータ活用をしていくことを考えると、有料版のGA4を契約することをおすすめします。

イー・エージェンシーは、これまで培ってきた豊富な知見をもとに、Google アナリティクス 4 プロパティ(GA4)の導入・運用や、Google Cloud(Google Cloud Platform/GCP)によるデータ統合、広告連携、アトリビューション分析、広告やメールなど顧客へのアプローチ施策の効果改善など、データ活用全般を支援しております。

まずは、お気軽にサービス資料請求、またはお問い合わせください。
みなさまのデータ活用をご支援させていただきます。


こちらの記事を資料でまとめてご覧いただけます!

ga4_360_faq8_ogp

本資料ではGA4を導入した後に起こるよくあるお悩みのうち、有料版を契約することで解決できる課題をまとめてご紹介します。有料版のご契約を検討されている方や、現在すでにご利用の方のデータ活用に貢献できれば幸いです。

 

GA4を導入するならイー・エージェンシーにご相談ください

イー・エージェンシーは、「Google マーケティング プラットフォーム(GMP)」の認定セールスパートナー、「Google クラウド プラットフォーム(GCP)」の認定パートナーです。
また弊社はGoogleより2021年上半期における Google アナリティクス 4 プロパティ(GA4)の数多くの導入支援実績を評価され、認定セールスパートナーとしてアワードを受賞しております。
これまでの豊富な実績を元に、GA4導入・移行をお客様のビジネスに寄り添い支援させていただきます。

まずはお気軽にご相談ください。
お客様のデータ活用を伴走型で支援いたします。

私たちは、ビジネス課題を解決する支援を行っております
サービスについてお気軽にご相談・お問い合わせください
この記事を書いた人
神崎 恵

マーケティングプランナー 新卒でイー・エージェンシーに入社。 デザイナー兼マーケティングプランナーとして活動しています。ウェビナーやトレーニング動画の編集にも従事。