データ分析をする前にすべき最も重要なたった一つのこと

今回は、分析をする前に必ず行わないといけない重要なプロセスについて解説していきます。

分析をする前に数字や、数字が格納されているcsvファイル、ローデータと呼ばれるデータベースなどを触ってはいけません。

数字を見る前にすべきことは分析プロセスをデザインすることです。

分析プロセスをデザインするために必要な5つのことについて今回は話します。

この記事でわかること

  1. マーケティングのデータ分析現場におけるよくある間違いと問題
  2. 分析しているのに問題が正しく認識できない理由
  3. 分析のための重要3ステップ
  4. 分析の前にやるべき分析概念図の作り方
  5. データ分析における政治的活用の危険性について

データ分析を行う上での必須条件

データ分析における間違いとして、こんな質問をよく受けます

  • うちには大量のデータがあるから、有効活用したい
  • データはあるんでこれで何か分析してほしい
  • これらのデータから何がわかるだろうか?

これらの質問にはどこに問題があるのでしょうか?

ここに2つのデータがあるとします。

  1. 顧客の情報(住所、性別、年齢、年収、どの広告経由で会員になったか)
  2. リスティング広告、ディスプレイ広告のクリック数、コンバージョン数3年分

さて、何がわかりますか?

これは非常に難しい問いで、確かにデータから何かを得ることはできますが、データを眺めているだけではどんな優秀な分析者であってもその能力を発揮することができません。

なぜなら、分析には明らかにしたい「課題」や「目的」が必要だからです。データから発想を得ようとしていること、手段が目的化していることは分析を難しくします。

データから発想を得ようとしていること、手段が目的化していることは分析を難しくします。

例えば、先ほどのデータに対して「リスティング経由とディスプレイ経由の顧客、20代の売り上げが多いのはどっちか?」などの問いがあれば、分析(というよりはこの場合は集計ですが)のイメージが具体的につきます。

しかし、現場はもう少し複雑にできています。

マーケティングのデータ分析現場におけるよくある問題

データ分析してもそれが何に活かせるのか、よくわからん...

という問題です。例をあげましょう。

広告代理店の担当者や、マーケティング担当者がその上司から「広告の効果を報告せよ」と言われることがよくあると思います。
たとえば、毎月リスティング広告の効果を月次レポートして報告するなどですね。こんなことは起こっていないでしょうか?

<よくある集計の例>

  • クリック数、インプレッション数などの各種数字のトレンドを報告する
  • どの広告文のCTRが高かった、低かったという報告をする
  • こういうキーワードでコンバージョンが発生したと集計する
  • どのページのアクセス数が多かったと報告する
  • ランディングページAとBのテストの結果、Aがよかったと報告する
  • 時間帯別の集計データを報告する
  • 配信ドメイン別の集計データを報告する

私もそんなにたくさんの事例を見ているわけでありませんが、前職でさまざまな代理店の分析と呼ばれる月次、週次の報告書を見てきました。
中でも現在マーケティングのコンサルタントとして仕事をしていると、大半はこういったレポートが報告書としてクライアントに提出されておりました。

更にもう少し複雑な集計データをいただくこともあります。

そして、それに対するクライアント企業や、上司の回答はこれです。

  • 『で、何が問題なの?』
  • 『で、どうすればいいの?』
  • 『で、どうやったらコンバージョンは増えるの?』
  • 『で、10時~12時は広告止めればいいの?』

必須条件が正しく認識できない理由

残念ながら先ほど最後のほうで書いたやりとりが多くの会社の定例会や報告会で行われてしまっているのが実情で、定例会はやっているが何か月も現状打破できない状態が続いている、という話はどこでも聞きます。

代理店には、だいたいテンプレート化された報告レポートがありますが、そういったレポートで報告されても、実は何の問題解決にもならないのです。これはたった1つの原因から来ています。

その原因は、何を明らかにしたいか?を整理せずにデータと向き合っている、です。

『分析には明らかにしたい「課題」や「目的」が必要』と先ほど書きましたが、テンプレート化された報告レポートを使うと、すでにデータが集計された状態でアウトプットされてきますので、意識しないと、そういった課題や目的を考える機会が失われしまいます。

しかもなにやらデータやチャートがたくさん並んでいるので、分析した気分になってしまい、課題や目的を考えることをやめてしまって、集計された報告書だけを提出する事に慣れてしまいます。

「課題」や「目的」に向き合うことを意識しないと、自分でデータを扱ってレポートを作る時にもこういった問題を引き起こしてしまいます。

<自分で分析をする際に起こる問題>

  • こんなデータもあるといいな、こうしてみよう、と分析がどんどん横道にそれる
  • 分析中にいろんな方向に考えがずれて、最終的に何が分析したいのかわからなくなる
  • 分析にものすごく時間がかかる
  • 最初に明らかにしたかったことが解明されないばかりか、まったく違った関係のない結論になって出てくる
  • それでも、まあ、なんとなくデータの集計ができているのでこれでいいかと思う
  • 何も問題が解決しない
  • 別の問題が出てくる
  • 場当たり的な対処が続く

    以下は分析を間違った分析を行ってしまし、的外れな解決策を導き出してしまうことによる問題の連鎖的拡大ループについての概念を示したものです。

    こうならないためには、データ分析を行うにあたって正しいスタンスで挑む必要があります。

    そこで重要なのが「課題の明確化」「仮説の設定」「データの整理」の3つのステップです。

    <分析のための重要3ステップ>

    1. 何を明らかにしたいのか?何を知りたいのか?(課題の明確化)
    2. そのためにはどんな情報があればよいのか?(仮説の設定)
    3. どこに行けばそのデータがあるのか?、どんな分析手法をとるべきか?(データと手法の整理)

    分析者が出してくるアウトプットが問題解決にあたって非常に有用であるのを見ると、データ分析者が何かものすごく特殊な分析手法を用いていたり、複雑な統計手法を用いていると思われがちです。

    しかし、その大半は「問題を正しく定義」することに時間が充てられていることが多いのです。

    問題を「正しく定義すること」が、分析の大半を占めるといっても過言ではありません。

    これをふまえた上で、具体的に、データ分析前にやるべきことを6つのステップで紹介します。

    分析の前にやるべき分析概念図の作り方6つのステップ

    データ分析に関して、実際に数字を触る前にやるべきこととして、簡潔にまとめられている考え方がありますので、こちらを出典として記載しておきます。

    データマイニングについては、CRISP-DM(CRoss-Industry Standard Process for Data Mining)などが有名ですが、CRISP-DMについてはまた別の機会に話すことにしましょう。

    1. 問題領域の決定
    2. 評価軸の決定
    3. 問題の具体的記述
    4. 要因の列挙
    5. 要因の選択
    6. 部品の配置


    出典:本物のデータ分析力が身に付く本(2016) 日経BPムック

    データを分析するにあたって、以下のことを覚えておいて下さい。

    <重要な考察>

    1. たくさんのデータがあるからと言って、良い分析ができるとは限らない
    2. たくさん時間をかけたからと言って、良いアウトプットが出るとは限らない
    3. 統計の知識があっても、良いアウトプットになるとは限らない
    4. データを分析すれば何らかの結果は出るが、それが意思決定に直結する重要な結果とは限らない
    5. 仮説なきデータ分析は、ほとんど役に立たないことが多い
    6. その割には、分析した気になる

    思考と情報のパラドックスの図を以下に示しましたが、情報量がある一定量を超えると指向が停止してしまい、かえって分析のアウトプットの質が落ちる、という話です。

    【出典】齋藤 嘉則(2010)『新版 問題解決プロフェッショナル―思考と技術』ダイヤモンド社

    「データ分析における政治的活用」の危険性について

    最後にデータ分析の活用と、データ分析の政治的活用の違いについて述べます。

    データ分析における政治的活用とは

    • 営業担当者が自社の商品に有利な条件で数字を見せる
    • 自分の提案を通すために都合の良い結果だけを見せる
    • 売り上げが上がっているように見せる
    • 差がないのに差があるように見せる(よく”p-hacking”とか言います)
      ※こういう結論に持っていきたい、という結論ありきで集計されるデータはすべて「政治的に活用される」分析出るといってもよい。

    活用できるデータ分析とは何か

    • 問題の本質を指し示している
    • 発見がある

    何を明らかにしたいか?を整理せずに分析を始めることの危険性について述べましたが、データを政治的に利用するために結論ありきでデータを作る(あえて分析するとは言わず、データを作ると言っておきます)ことも、また危険であることを述べておきます。

    政治的な利用においては、ストーリーありきで作られることが多く、一見すると利き手にはそのストーリーや分析結果が正しいものであるように感じることがあります。

    先ほど、的外れな解決策を導き出してしまうことによる問題の連鎖的拡大ループについて説明しましたが、これら「政治的に活用されるデータ」は全くといってよいほどに、このループに入ってしまいます。

    間違った決断の結果、広告費の無駄遣いや事業の撤退、判断の遅れに繋がりますので注意しましょう。

    詳細事例はここではあげませんが、いかにデータが恣意的に作られているかというような話はいろんな本も出ておりますし、多くの方が論じているところであります。

    参考文献

    まとめ

    本日のまとめです。データの分析をする、マーケティングの成果を報告するといったシーンに遭遇した際には以下のことを思い出してください。

    • いきなり数字を見ようとしない
    • 数字を見る前に、データ分析の目的を定義する
    • 結論ありきで恣意的なデータを準備しない

    以上です。

    正しい方法でデータ分析に取り組むと、多くの問題を整理することができ、目的の達成まで最短の時間で到達することができるようになるでしょう。

    (執筆:福田正義)

     

    その他の記事はこちら

    1 他の人が作った分析結果を正しく読み解く方法について

    2Webマーケティングの分析でよくある失敗とその原因」

    3「データ分析をする前にもっとも重要なたった1つのこと」

    4「分析とは何か?ー統計を学ぶ前に知っておかないといけない分析の話」

    5「『広告配信をしたら認知度が上がった』は本当?ー因果関係を正しく理解する」