ウェブサイトやアプリに同意モードのバナーを実装すると、アナリティクスでは、同意を拒否したユーザーに関するデータの欠落が生じます。同意モードの行動モデリングでは、機械学習を使って、アナリティクスの Cookie を受け入れた類似ユーザーの行動を基に、アナリティクスの Cookie を拒否したユーザーの行動をモデル化します。モデル化されたデータを使用すると、ユーザーのプライバシーを尊重しながら、アナリティクスのレポートから有益な分析情報を得ることができます。
たとえば、行動モデリングでは、ユーザーやセッションに関する指標(1 日のアクティブ ユーザー数やキーイベント率など)に基づいて、Cookie やユーザー ID などの識別子を一部利用できない場合は測定不可能なデータを推定します。行動モデリングは、次のような重要な情報を得るために役立ちます。
- 1 日のアクティブ ユーザー数はどれくらいか
- 前回のキャンペーンで獲得した新規ユーザーは何人か
- ユーザーは、ウェブサイトにアクセスしてから実際に購入するまでどのような経路を通ったか
- ドイツからのサイト訪問者とイギリスからのサイト訪問者はそれぞれ何人か
- モバイル ユーザーとウェブユーザーではどのような行動の違いがあるか
モデル化データと実測データ
ユーザーがサイトにアクセスし、アナリティクスの Cookie に同意した場合、または Android の設定で広告 ID によるパーソナライズを無効にしなかった場合、アナリティクスはユーザーの行動をさまざまな識別子に関連付け、測定の継続性を可能にします。このようなデータは、行動の観察をアナリティクスに許可したユーザーによって提供されることから、Google ではこれを「観察可能なデータ」と呼んでいます。
ユーザーが同意しなかった場合、イベントは永続的なユーザー識別子に関連付けられません。たとえば、アナリティクスで 10 件のページビュー イベントを収集した場合、それが 10 人のユーザーか 1 人のユーザーかを識別してレポートすることはできません。代わりに機械学習を使用して、アナリティクスの Cookie または同等のアプリ識別子を受け入れている類似ユーザーの行動に基づいてユーザーの行動を推定します。
モデリングに使用されるトレーニング データは、モデリングが有効になっているプロパティから得られた実測ユーザーデータに基づいています。
Google による行動モデリングのアプローチ
Google による行動モデリングのアプローチでは、次に示す機械学習のベスト プラクティスを採用しています。
精度の検証と変更の通知
Google のモデルは、ホールドバック検証によってその精度が維持されています。推定ユーザーデータと、モデル トレーニングから取り分けておいた実測ユーザーデータの一部を比較し、その比較情報を使ってモデルが調整されます。データに大きな影響が出る可能性がある場合は、変更内容が通知されます。
厳格なレポート基準の維持
行動モデリングがレポートに含められるのは、モデルの品質に高い信頼性がある場合のみです。たとえば、モデルに情報を提供するのに十分な量の同意済みトラフィックがない場合、同意を拒否したユーザーによってトリガーされたイベントはレポートの対象になりません。これにより、データの精度が確保されます。
ビジネスに合わせたカスタマイズ
Google のモデリングの汎用アルゴリズムを個別に適用することで、ビジネスやユーザー固有の行動が反映されるようにしています。
要件
モデルのトレーニングは Google アナリティクス 4 プロパティの実測データを基にして行われるため、モデルをトレーニングするのに十分なデータがプロパティで必要となります。行動モデリングを利用するには、プロパティで次の条件を満たしている必要があります。
- 同意モードが、サイトのすべてのページと、すべてのアプリ画面で有効になっている。
- 同意ダイアログが表示される前にタグが読み込まれ、ユーザーの同意の有無にかかわらず Google のタグが必ず読み込まれるようにウェブページの同意モードを実装する必要があります(高度な実装)。
- プロパティで、少なくとも 7 日間、1 日あたり 1,000 件以上の analytics_storage='denied' のイベントが収集されている。
- 過去 28 日間のうち少なくとも 7 日間、1 日あたり 1,000 人以上のユーザーがプロパティで analytics_storage='granted' のイベントを送信している。
- モデルのトレーニングが成功するためには、その 28 日間でデータしきい値に達している日数が 7 日より多く必要な場合があります。ただし、追加のデータがあってもモデルをトレーニングするのに十分ではない場合もあります。
行動モデリングは、特定のプロパティが対象となった時点で自動的に有効になります。モデリングが有効になると、混合型のレポート用識別子の説明で選択できるようになります。
まれなケースとして、行動モデリングの前提条件を満たしていたプロパティが条件を満たさなくなった場合は、推定値を利用できなくなります。この場合、行動モデリングの要件を満たすことで推定値を再び利用できるようになります。推定値が利用できるのは、プロパティが再度要件を満たした日以降になります。
モデル化されたデータをレポートで表示または非表示にする
モデル化されたデータをレポートで表示するには、混合型のレポート用識別子を選択します。
モデル化されたデータの表示を停止するには、別のオプションを選択します。選択したオプションがデータの収集や処理に影響することはありません。このオプションはいつでも切り替えることができ、データに永続的な影響を与えることもありません。詳しくは、レポート用識別子の詳細をご覧ください。
Google アナリティクスで行動モデリングが表示される仕組み
アナリティクスでは、モデル化されたデータと実測データがレポートにシームレスに統合されます。アナリティクスにモデル化されたデータが含まれる場合、実測データのみが含まれるレポートと差異が生じることがあります(モデル化されたデータが含まれるレポートではユーザー数が多くなるなど)。
モデル化されたデータが統合されるタイミングを確認するには、データ品質アイコン(下図を参照)を使用します。
次の表は、アイコンに表示されるメッセージをまとめたものです。
データ品質アイコンのステータス | 説明 |
---|---|
ユーザーデータの推定値を含む | アナリティクスでは、[モデリング発効日] の時点で、Cookie 使用への同意が得られなかったなどの理由で不足しているデータに推定値が使用されます。 |
ユーザーデータの推定値を含む |
アナリティクスでは、[モデリング発効日] の時点で、Cookie 使用への同意が得られなかったなどの理由で不足しているデータに可能な範囲で推定値が使用されます。 |
ユーザーデータの推定値を含む |
アナリティクスでは、[モデリング発効日] の時点で、Cookie 使用への同意が得られなかったなどの理由で不足しているデータに推定値が使用されます。 *昨日の推定データはまだ利用できない場合があります。 |
ユーザーデータの推定値を除く | プロパティのレポート用識別子の設定では、Cookie 使用の同意が得られなかったなどの理由で不足しているデータに推定値は使用されません。「ハイブリッド」設定を使用しない限り、レポートには識別子の使用に同意したユーザーから収集されたデータのみが含まれます。 |
ユーザーデータの推定値は利用できません | このプロパティが推定値の対象となった日付より前の期間が選択されています。 |
ユーザーデータの推定値は利用できません | このレポートには、維持率のデータまたはシーケンスを含むセグメントが含まれています。そのため、推定値は含まれていません。 |
ユーザーデータの推定値は利用できません | プロパティが推定値を使用するための利用条件を満たしていません。 |
アナリティクスの管理画面の一部のページでは、モデリングのステータスに関する情報が記載されたバナーも表示されます。
次の表は、バナーに表示されるメッセージをまとめたものです。
バナーのメッセージ | バナーの場所 |
---|---|
ほとんどのテンプレートには、ID の使用に同意したユーザーのデータのみが含まれています。ただし、自由形式およびセグメントの重複のテンプレートは例外で、推定ユーザーから収集されたデータが含まれています。 | データ探索のトップページ |
データ探索にシーケンスが定義されたセグメントが含まれている場合、ID の使用に同意したユーザーのデータのみが表示されます。 | データ探索の詳細ページ |
この [レポート / データ探索 / オーディエンス] には、ID の使用に同意したユーザーのデータのみが含まれています。 | データ探索の詳細ページ |
このセグメントにシーケンスが含まれている場合、ID の使用に同意したユーザーのデータのみが表示されます。 | セグメント ビルダー |
データ探索でのモデリング
経路データ探索とファネル データ探索でのモデリング適用方法は、レポートの場合とは異なります。レポートでは、ユーザー数、セッション数、新規ユーザー数などの指標にモデリングが適用されます。ただし、page_view
、first_visit
、session_start
などのイベントの数には適用されません。永続的なユーザー ID をイベントに関連付けることにユーザーが同意していない場合、アナリティクスはイベントが同じユーザーのアクションであるかどうかを検出できません。ページが読み込まれるたびにイベントが送信されるため、該当ユーザーの first_visit
イベントと session_start
イベントの数が多くなります。
一方、経路データ探索やファネル データ探索では、first_visit
イベントと session_start
イベントにモデリングが適用されます。永続的なユーザー ID をイベントに関連付けることにユーザーが同意していない場合、アナリティクスは first_visit
イベントと session_start
イベントの実際の数を推定します。このため、経路データ探索やファネル データ探索では、first_visit
と session_start
のイベント数がレポートよりも少なくなります。
サポートされていない機能
次の機能はモデル化された行動データの使用に対応していません。