定義:
生データ これは、加工されていない元の状態のデータです。集計、平均化、フィルタリング、あるいはその他のいかなる変換も施されていません。.
詳細なデータ これは、データの最も詳細なレベル、つまりダッシュボード上に表示される集計数値の根底にある個々のレコード、イベント、および属性を指します。.
実際には、この2つの用語はしばしば同じ意味で使用されます。どちらも、より深く、より正確な分析を可能にするデータの基盤となる層を指しています。.
生データとは何ですか?
生データとは、SDK、API、データパイプライン、デバイスイベントなどのソースから直接収集され、変更を加えることなく保存されるデータのことです。これは、いかなる処理も施される前のデータです。.
単一の生データレコードだけでは、あまり有益な情報は得られないかもしれません。しかし、それらを集計し、自由にクエリを実行したり、フィルタリングや結合を行ったり、自ら分析したりできるようになれば、生データはモバイルマーケティングチームやプロダクトチームにとって、最も強力な資産の一つとなります。.
ほとんどの分析プラットフォームでは、デフォルトでデータが集計された形で表示されます。これらのプラットフォームは、生のレコードを基に、パフォーマンスをざっと把握するのに役立つ合計値、平均値、および要約値を表示します。生データは、こうした要約値の根底にあるものであり、要約だけでは不十分な場合に必要となるものです。.
「グラニュラーデータ」とは何ですか?
「詳細データ」とは、可能な限り詳細なレベルで収集されたデータのことです。集計データが合計値や平均値を示すのに対し、詳細データは、その合計値を構成する個々のレコードを提供し、各レコードには固有の属性、タイムスタンプ、識別子が含まれています。.
この違いを理解するための有用な考え方:
| データ型 | 目に見えるもの |
| 集計データ | 特定の日における購入による総売上高 |
| 詳細なデータ | 個々の購入ごとに:商品ID、通貨、総売上高、純売上高、数量、タイムスタンプ、広告ID、OSバージョンなど |
集計ビューは高速で、見やすい。.
「詳細ビュー」では、調査、セグメント化、および構築を行うことができます。.
詳細データと集計データ
集計データはモニタリングに最適です。表面的な状況がどうだったかを把握でき、何かおかしい点があれば警告してくれます。読みやすく、迅速な対応が可能であるため、ほとんどのダッシュボードはこれを中心に構築されています。.
何かが起こった理由を理解したいときや、探している答えが要約からは見つからないときは、詳細なデータが必要となります。.
詳細なデータがあってこそできることには、次のようなものがあります:
- プラットフォームがデフォルトでは表示しないカスタム指標を計算する
- 特定のユーザーの行動や一連のイベントを調査する
- 2つの異なるソースからのデータセットを結合します。例えば、IAP収益データとインストールアトリビューションデータを照合し、どの広告ネットワークが購入に至ったユーザーを誘導したかを把握します。
- 特定のビジネス上の課題に合わせて、カスタムレポートやダッシュボードを作成できます
- 既成のレポートでは対応できないレベルの詳細度でコホート分析を実行する
分析にダッシュボードで表示できる情報以上のものが必要な場合は、生データや詳細なデータにアクセスする必要があります。.
生データが重要な理由
自分なりの疑問を自由に投げかけること
ダッシュボードは、設計者が想定していた疑問に答えてくれます。生データを使えば、これまで誰もレポートを作成しようとは考えもしなかったような疑問を投げかけ、真の答えを得ることができます。.
近似よりも精度
集計データにはトレードオフが伴います。平均値は変動を平滑化してしまいます。合計値は、その背後にある分布を隠してしまいます。詳細なデータなら、そうした妥協をすることなく、全体像を把握することができます。.
カスタム指標の算出
分析プラットフォームが標準で算出していない指標が必要な場合は、詳細データを活用して作成します。ロジックを定義し、それを生データに適用することで、必要な数値を正確に得ることができます。.
データセットの結合
最も価値のある分析の多くは、複数のソースからのデータを連携させる必要があります。例えば、IAPの収益データとアトリビューションデータを結合するには、ユーザーIDやデバイスIDなどの共通の識別子を共有する、両方のソースからの生データレコードが必要です。集計済みのデータでは、有意義な形で結合することはできません。.
監査および調査
指標に不審な点があったり、キャンペーンの結果に違和感を感じたりしたときは、実際に何が起きたのかを確認するために、詳細なデータを確認する必要があります。詳細なデータこそが、その根拠となる証拠となるのです。.
生データとDataVault
まさにこれが、TenjinがDataVaultとRaw Data Exporterを開発した理由です。前者は、イベントレベルの生データに直接アクセスできるデータウェアハウスサービスです。Raw Data Exporterも同様の機能を提供しますが、Tenjinのダッシュボードから直接アクセスできます。.
DataVault なら、Tenjin のダッシュボードに表示される情報だけに限定されることなく、独自のデータをクエリしたり、カスタムレポートを作成したり、さまざまなデータソースのデータセットを結合したり、標準的なレポート機能では対応できないようなきめ細かな分析を実行したりすることができます。データは、保存され、アクセス可能で、すぐに活用できる状態で保持されるため、チームのニーズに合わせていつでも利用可能です。.
特定の分析ニーズを持つチーム、生のレコードを直接扱いたいデータサイエンティスト、あるいは既成のダッシュボードでは物足りなくなってきた方にとって、DataVaultは集計ビューへの依存を解消し、データセット全体を自由に活用できるようにします。.
モバイルマーケティングにおける詳細データの例
これを具体的に説明するために、必要な答えを得るために詳細なデータが不可欠となるいくつかのシナリオを以下に挙げます:
歳入調査
ダッシュボードでは、1日の総売上高を確認できます。しかし、特定のユーザーが特定の日付に特定の商品に対して、通貨、数量、手数料控除後の純売上高を含め、正確にいくら支払ったかを確認するには、購入イベントの生データが必要です。.
帰属分析
どの広告ネットワークが、後に有料ユーザーへと転換したインストールを促進したかを把握するには、共通のユーザー識別子を使用して、生のアトリビューション記録と生の購入イベントを結合する必要があります。どちらの記録も、もう一方と組み合わせなければ意味を成しません。.
顧客維持コホート分析
特定の獲得コホート向けにカスタムリテンションモデルを構築するには、あらかじめ集計されたリテンション率ではなく、そのコホートに属するすべてのユーザーに関するイベントレベルのセッションデータが必要となります。.
不正調査
クリック数やインストール数のデータに、不正トラフィックを示唆するような異常なパターンなどが見つかった場合は、合計値ではなく個々の記録を確認する必要があります。こうしたパターンが見つかった場合は、ダッシュボードにある当社の別のツール「Site ID Optimization」を使用して、サイトIDレベルでそれらをブロックすることができます。.