表やグラフを使ってデータを探索します。
「自由形式のデータ探索」は、高度なカスタマイズ性と柔軟性を備えた分析手法です。たとえば次のような操作が可能です。
- 表やグラフでデータを視覚化
- 表の行や列を自在に組み替え
- 複数の指標を並べて比較
- 行をネストしてデータをグループ化
- セグメントやフィルタで自由形式のデータ探索対象を絞り込み
- 選択したデータからセグメントやオーディエンスを作成
自由形式のデータ探索を作成する
- Google アナリティクスにログインします。
- 左側の [探索] をクリックします。
- 画面上部で [自由形式] テンプレートを選択します。
- [ビジュアリゼーション] 欄で、データの視覚化方法を選びます。
|
|
詳しくは、データ探索の作成と編集をご覧ください。
自由形式のデータ探索の例
下の例では、デバイス カテゴリと画面の解像度の関係を、ユーザー数と収益を基準に国別で検証しています。パソコン ユーザーの画面解像度は 1366×768 が多数派ですが、収益の大部分は 1440×900 のユーザーから生じていることが、この表でわかります。このデータポイントからセグメントを作成すると、このユーザー層の行動パターンに対する理解を深めることができます。
さまざまな手法でデータをビジュアル表示することも可能です。次の例は、上のデータ表に、モバイル トラフィックと自然検索トラフィックを比較する折れ線グラフを適用したものです。さらに他のビジュアル表示を選択することで、サイトまたはアプリを利用したユーザーに関するさまざまなインサイトを得ることができます。
異常検出
異常検出では、折れ線グラフを使ってデータの外れ値を特定できます。
折れ線グラフで異常検出を使用すると、データの外れ値を特定できます。このオプションは [タブ設定] パネルではデフォルトで有効になっており、次の 2 つの設定で検出モデルを構成できます。
- トレーニング期間(直前の期間): 表示される指標値を予測するために、現在選択されている期間の何日前からデータを異常検出モデルに使用するのかを決定します。
- たとえば、現在選択されている期間が月の最初の 10 日間で、トレーニング期間を 7 日間に設定した場合、データはその月が始まる 7 日前から異常検出モデルに使用されます。
- 感度: 確率のしきい値を設定します。設定すると、これを下回った異常データが報告されるようになります。感度は、モデルの「考え方」には影響せず、データにラベルを付ける方法のみを指定します。特定の値で発生するポイントの確率は、モデルによって予測され、感度の影響は受けません。
- たとえば、感度が 5% の場合、5% 未満の確率で発生するポイントは異常と見なされます。したがって、感度モデルを高くすると、より多くのデータが外れ値として報告される可能性があります。
異常検出モデルを定義すると、ベイズ統計の状態空間時系列モデルがトレーニング データに適用され、時系列に表示される指標の値が予測されます。
最後に、統計的有意性テストをもとにデータポイントが評価され、異常があれば報告されます。p 値のしきい値は、選択した感度に基づいて決定されます。
自由形式のデータ探索を設定する
以下のオプションを使って自由形式を設定します。
共通のオプション | 説明 |
---|---|
ビジュアル表示 |
グラフの種類を切り替えます。 |
セグメントの比較 | 最大 4 個のセグメントをデータ探索に適用します。 |
フィルタ | 指定された条件に基づいて、データ探索に表示されるデータを絞り込みます。フィルタ句は AND 論理演算で適用されます。 |
表のオプション | |
ピボット | 表内のセグメントを行または列として表示します。 |
行 | 最大 5 つのディメンションを表の行として表示します。 |
最初の行 | 表内に表示される最初の行を選択します。 |
表示する行数 | 表内に表示される行数を設定します。 |
列 | 最大 2 つのディメンションを表の列として表示します。複数のディメンションを使用すると、列グループが作成されます。 |
最初の列グループ | 表内に表示される最初の列グループを設定します。 |
表示する列グループ数 | 表内に表示される列グループの数を設定します。 |
値 | 最大 10 個の指標を表内に表示します。 |
セルタイプ | 指標の値を書式なしテキスト、棒グラフ、またはヒートマップとして表示します。 |
円グラフのオプション | |
内訳 | ビジュアル表示のデータ系列を細かく分割するために使用するディメンションです。 |
行数制限 | ビジュアル表示に含めるデータ系列の数を設定します。 |
値 | グラフに 1 つの指標を表示します。 |
折れ線グラフのオプション | |
詳細レベル | グラフの期間の単位を設定します。週の場合は日曜日から始まります。月の場合は 1 日から始まります。 |
内訳 | ビジュアル表示のデータ系列を細かく分割するために使用するディメンションです。 |
ディメンションあたりの線数 | ビジュアル表示に含めるデータ系列の数を設定します。 |
値 | グラフに 1 つの指標を表示します。 |
異常検出 | 異常検出をオンまたはオフにします。詳しくは以下をご覧ください。 |
トレーニング期間(継続日数) | データの検証に使用される期間を調整します。トレーニング期間が長いほど精度が上がります。 |
感度 | 確率のしきい値を設定します。設定すると、これを下回った異常データが報告されるようになります。しきい値の設定が高くなるほど、異常の報告が増える場合があります。 |
散布図のオプション | |
内訳 | ビジュアル表示のデータ系列を細かく分割するために使用するディメンションです。 |
Y 軸 | 縦軸で使用する指標です。 |
X 軸 | 横軸で使用する指標です。 |
地図のオプション | |
地域の内訳 | ビジュアル表示のデータ系列を細かく分割するために使用する地域ディメンションです。 |
ディメンションあたりのポイント | ビジュアル表示に含めるデータポイントの数を設定します。 |
値 | グラフに 1 つの指標を表示します。 |