ビジネスにデータを活かすポイント~マーケティングにおけるデータ分析の肝とは~

新規事業

2019年08月30日(金)掲載

キーワード:

「ビッグデータ」や「データサイエンティスト」という言葉がバズワードとなったのは少し前のことで、今はかつての勢いもやや沈静化された様子ですが、それにしても自社の持っているデータを何とか活用したいと日々努力している企業も多いはずです。むしろ、そのような機運がさらに広がっているのではないでしょうか。

しかし、どの企業もうまくデータを使えているかというと、本当の意味でデータを活用できてない企業はまだまだ多いというのが筆者の印象です。実際に会員データがあるがどうやって分析すればいいのかわからない、DMPを構築してみたもののうまく運用できていない、分析のスペシャリストがいない、といった悩みをよく伺います。

本コラムでは、企業がデータ分析を行う上での肝となる基本ファクターをご紹介します。


データ分析の必要性

まず、なぜデータ分析が必要なのかということを考えます。ビジネスというものは判断の連続です。何かの基準で連続的に判断をしていかなければなりません。成功もあれば失敗もします。そこでデータを分析してより良い判断を目指します。この意味において、データ分析には以下の4つの特徴があると考えます。

1.客観性 
様々なメンバーが関わるプロジェクトでは、必ずしも意見が一致するとは限りません。むしろ判断が分かれることのほうが多いはずです。その時に客観的な判断基準を与えてくれるのがデータ分析です。
ただし、分析結果を見ても判断できないという状況も散見されます。これは判断基準が共有できていないためであり、これを避けるにはこの基準を上回ればGOにするといったノーム値を蓄積する、あるいは検定を行い有意差の有無を判断する、専門家としてアナリストが判断する、といった方法が考えられます。

2.科学性 
科学性というのは、まさに「サイエンス」ということです。つまり理論を積み重ねて法則性を見出すことです。
法則性というのは、いつでもどこでも誰が行っても、同じ結果になるということです。
そこに到達するには、データ分析だけで可能になるわけではありませんが、その大きな一端を担うのは間違いありませんし、当然これには正しい仮説の構築と検証過程が必要となります。やみくもにデータをこねくり回せばいいというものではありません。

3. リスクヘッジ
1、2と重複する概念ですが、前述のように正しくデータ分析をすれば、より正しい判断につながります。つまり、失敗の確率を少なくすることができるはずです(残念ながらゼロにはなりません)。そこに客観性を持たせれば、判断で揉めることも無くなります。商品開発において何案かのプロトタイプモデルを開発し、評価テストを行い顧客の好みの傾向を分析するというプロセスはまさにこれに当たる行為です。

4.整理と予測
データ分析は様々なアプローチによって課題を解決するのに役立ちますが、その中でも特に特徴的なものが整理と予測です。

まず整理に関してですが、ビジネスの判断には多岐にわたる要素が複雑に絡み合っています。一つ一つの要素を考えていると時間もかかり、それ以前に複雑すぎて収拾がつかなくなります。このようなときに、多数の「要因」(統計的には「変数」)を分析して、全体を表すような少ない数の軸やグループに整理します。専門的には、「空間を圧縮する」と表現します。個々の要素をバラで考えるよりずっと人間の頭で理解しやすくなり、分析も楽にできるようになります。アウトプットもすっきりしますので、プロジェクトメンバーがより理解ができるようになります。

次に予測です。(未来を予知するという意味ではありません。)
これは前述の法則性を発見するということに他なりません。いつでもどこでも誰がやっても、同じ結果になるという法則を発見すれば、それが予測できるということです。手法に関しては後で簡単に触れますが、データ分析のスペシャリストが行えばかなりの精度で予測が可能になるはずです。

CRISP-DM

データを深く分析し、難しい課題に対しての解を見出すことをデータマイニングといいますが、このデータマイニングを進めていく工程において一般的に提唱されている方法論が「CRISP-DM」と呼ばれるものです。

これは、Cross-Industry Standard Process for Data Mining の頭文字をとったもので、どの業界においても共通して使えるデータマイニングの標準的工程という意味です。

CRISP-DMでは、以下のステップで分析が進みます。

1. Business Understanding(ビジネス課題の理解)
2. Data Understanding(データの理解)
3. Data Preparation(データの準備)
4. Modeling(モデルの構築)
5. Evaluation(評価)
6. Development(展開/共有)


もちろんすべての工程が重要ですが、あまり上手くいかないケースの例として、1のビジネス課題の理解の欠如があげられます。もちろんブランドマネージャーなどの担当者にとっては当然理解している話ですが、これが分析担当者に理解されていない場合があります。

分析者はまず徹底的に分析対象となる商品やサービスのヒヤリングを行い、十分に現状と課題を理解する必要があります。そしてビジネス課題を分析課題に翻訳し直す作業が必要となります。そこから分析設計に入ります。そうでなければ、正しい解を得るための正しい仮説を導くことはできません。

利用価値のあるデータ

では、どのようなデータが分析に使えるのかということですが、ビジネス全般を対象にすると、その課題の内容次第で必要なデータの領域が非常に幅広くなりますので、ここではマーケティング領域に限定してお話をします。

マーケティング領域で一般的に取得できるデータは以下のようになるのではないでしょうか。

まずは、大きく分けてオンライン上とオフライン上で取得できるデータがあります。マーケティングデータと言いますとネット上で取れるデータに目が行きがちですが、生活者はオンラインをオフラインも行き来していますので、これらを統合して分析することがより正確に生活者をとらえるうえで重要です。

1.オンライン上で取得できるデータ

(ア) 自社サイト、ブランドサイト、ランディングページのデータ:
Google Analyticsに代表されるツールで取得できるアクセスログ、コンバージョンデータ、購買ログなど

(イ) 広告接触履歴データ:
広告出稿をしている場合、個々の媒体社から提供される
3PAS(第三者配信)利用の場合には3PASベンダーよりまとめて提供されるので重複リーチなどより詳細がわかる

(ウ) 口コミ、SNSデータ:ソーシャルインサイトやコミュニケーション・エクスプローラーで代表されるツールで取得される
任意のキーワードに関する口コミの量的・質的データの取得が可能
ツールによって特徴がある

(エ) オーディエンスデータ
自社サイト以外のネット上で、生活者がどのように動いているかを捕捉するデータ
各種DMPベンダーより提供され、自社サイトのデータと融合してカスタマーの動きをとらえ、様々な分析が可能となる
また、昨今のアドテクの進化により、広告のターゲティング配信に利用されている

2.オフライン上で取得できるデータ
(ア) 各種リサーチデータ
自社で実施した市場実態把握調査やコンセプト調査、製品調査、ブランド浸透調査など
オープンとなっているセカンダリーデータ、メディア接触データなど

(イ) 購買データ、トランザクションデータ
会員の購買履歴データ、サービスの利用データ
非会員の場合もあるがその場合は連続したデータとはならない

(ウ) POSデータ
会員以外の購買データで小売店のレジで読み取られたデータを取り纏めて集計したデータ
どの商品がいつどこでどれだけ売れているかがわかる
当然名寄せはできないし、商品単位で集計されているので顧客は追えない

(エ) マーケティング活動履歴データ
会員に対して行ったプロモーション履歴や営業履歴
刺激に対する反応データも取れていることが望ましい
(オンラインで行えばオンラインデータとなる)

(オ) 顧客属性
性、年齢、居住地域、会員登録時期、累積購入金額など会員の属性データ
個人情報となるので取り扱いに注意が必要

他にもあるとは思いますが、いずれにしてもこれらのデータがすべて同時に分析に利用できるわけではありません。最初に設定された分析課題によって、これらの中から使うデータを選別して分析を行います。

よくビッグデータ分析と言われますが、分析課題によっては使えるデータはそれほど多くない場合が多いです。とは言え、先にも述べたように、できればオンライン・オフラインを統合して詳細な分析を行う必要があります。

そのためには、会員IDやその他のIDで各データが紐づいていること、もしくは時系列データとして、日次データや週次データなど粒度の揃ったデータであることが条件となります。

最適な分析手法とは

これらのデータをどう料理したいかで分析手法も異なってきます。(取れているデータの尺度によっても手法は異なってきますが、専門的な話になりますのでここでは割愛させていただきます。)

分析の目的は、そもそものビジネス課題に対する最適な解を見出すこと、そのための仮説を検証することです。そのため、いつも多変量解析などの高度もしくは難しい分析が正しいわけではありません。分析目的に沿った、極力シンプルな手法が望ましいと思います。

例えばCRM領域であれば、基本的なRFM分析や、アソシエーション分析、デシル分析などを組み合わせることである程度の課題は解決できると思います。また、一般的にはクロス集計や相関係数を見るだけでも正しい切り口であればそれで十分な場合も多いです。

「データ分析の必要性」の項目で整理と予測の話をしましたが、この領域になるとモデリングという手法の概念が必要です。統計的な手法にしても、複数の要因(変数)を同時に扱える多変量解析がその力を発揮します。

例えば、年間販売量やコンバージョン数を予測したいのであれば重回帰分析が適切な選択となりますし、顧客をあるプロモーションに反応しやすい順にスコアリングをしたいという場合にはロジスティック回帰分析やデシジョンツリーなどが選択肢となるでしょう。

これらの手法では予測やスコアリングといったアウトプットと同時に、どの要因がどれくらい重要であるかがわかるので、それらの要因をコントロールすることによって、成果を最大化するためのプランニングができるというのが最大の特徴です。

ただし、単にデータがあってこれらの手法を使えばいい分析ができるかというと当然そういうことはなく、モデリング精度を上げるには仮説の正確さとデータハンドリングの確かさが肝となりますので、分析の初期段階が非常に重要です。

文中、度々強調していますが、ビジネス課題に対して正しい分析手法を選ぶことは重要ですが、それだけでは十分でなく、正しい仮説を持ち、検証することが意味のあるアウトプットにつながります。そのためには、CRISP-DMの工程をしっかりと踏まえることが重要です。実際に、分析のための分析を何度も目にしてきました。

また、「Garbage In, Garbage Out!」という言葉で表現されるように、いくら高度な分析手法を使っても最初にインプットするデータがゴミであればアウトプットはゴミしか出てこないのです。つまりデータ取得の段階から分析はスタートしており、データクレンジングの工程も決して疎かにはしてはいけないのです。

※記事は執筆者個人の見解であり、パーソルキャリア株式会社の公式見解を示すものではありません。

ライター根本 朗生氏

国内・外資系広告代理店でストラテジック・プランナーとしてデータ分析からの戦略立案およびメディア分析を担当。その後、株式会社サイバー・コミュニケーションズにてアクセス解析、オーディエンスデータを中心とするWEB上のデータを利用した統合ソリューションサービスを提供している。

関連コラム