データ解析(手法)
クラスタ分析
- ・クラスタ分析のやり方についてご説明します。
- ・ただしここでご説明するのは、経営戦略の策定と反省を目的とした、簡略化した手法をお伝えいたします。
- ・一般的なクラスタ分析では、分析結果からクラスタの意味を見出さなければならず、この点がネックです。
- ・そこで、クラスタの意味付けを最初に人為的に行うようにします。
- ・そうして分析された結果から経営戦略を策定もしくは反省する方針とします。
- ・不明点あれば問い合わせください。
- ※当サイトで掲載しているデータは適当に作成したものであり、実際のものではありません。
クラスタ分析とは
クラスタ分析とは、分析対象を似通ったクラスタに分類する分析手法の総称です。
それらは大別して、階層型クラスタ分析と非階層型クラスタ分析があります。
前者はウォード法が有名で、後者はk-means法が有名です。
ウォード法とk-means法にはそれぞれ派生版があり、目的に応じて使い分ける必要があります。
以下、大雑把に特徴を挙げます。
ウォード法:
・階層型クラスタ分析
・精度は高いが計算コストも高く、小規模なデータの分析しかできない
※データ数が増えれば増えるほど分析に時間がかかる
・分析対象を望みの規模で分割できる
・データが分類されていく様をトレースできる
k-means法:
・非階層型クラスタ分析
・計算コストが低く、ビッグデータ解析においても利用されている
・分析対象を望みの規模で分割できる
・ランダムな割り振りを行っており、実施の度に分析結果が若干異なる
クラスタ分析では、分析対象をアルゴリズムで機械的にクラスタに分類します。
このため、分類された結果を人間が見たとき、それがどういったクラスタであるかを瞬時に判断することは困難です。
よって、分類後に改めてクラスタを調査し、クラスタごとに意味を見出していかなければなりません。
クラスタ分析においてはこの作業が重要ですが、データの扱いに慣れていない人からすると、ただただ労力を要するプロセスです。
そこでここでは、分類後にクラスタの意味を見出す一般的な流れとは逆に、最初にクラスタの意味付けを行うようにします。
意味付けを行った上で分析対象を分類することで、分析後の考察をスムーズにします。
ただしこれは一般的な手法ではありません。
および、ウォード法とk-means法については、そのような手法があるという紹介だけに留めます。
興味のある方はご自身でソフトをダウンロードするか自作するなりして試してみてください。
クラスタ分析のやり方
まず、分析対象とするデータを用意します。
以下にデータ(飲食店におけるPOSシステムの売上データ)の例を示します。
このようなトランザクションデータに対して、以下のような手順で分析を進めていきます。
【手順1】まず最初に分類する軸を決定します。
【手順2】軸に対して、どのように分類するか、基準値を決定します。
【手順3】手順1と手順2を踏まえ、データを分類していきます。
【手順4】分類されたクラスタに対して、データ数に極端な偏りがないか検証します。
※もし極端な偏りがあれば分類の仕方を調整し再分類します。
対象を分類できたところで分析は終了です。
後は、分類されたクラスタに対して、原因の考察と対応を考えていくのみです。
以下、上記の手順で分析した例です(以下、一部で、クラスタをクラスと称しています)。
分析結果より、人数が多いクラスより少ないクラスの方が圧倒的に客数が多く、売上額も高いことが分かります。
ゆえに、稼働率や回転率を見極め、テーブルや椅子の配置およびメニューは少人数向けを想定した方がよさそうです。
人数が少なく滞在時間が短いということは、コミュニケーションをとることよりも単純に食事をとることを目的として来店している可能性が高く、純粋に、提供するメニューの善し悪しが売上に影響していそうです。
ここで、クラスタは客層を意味しています。
上記では人数・滞在時間・単価としていますが、その他、性別・年代・来店頻度など、様々な属性を設定できます。
そうして幅広い視点で顧客を捉え、顧客のライフスタイルや来店の目的を考察し、マーケティング戦略の策定と反省を行います。
クラスタ分析の特徴
対象をクラスタに分類するのがクラスタ分析です。
そういう意味では、ABC分析も分類する分析であり、クラスタ分析のようなものと言えます。
ABC分析では、割合に応じてクラス分けしていました。
対してクラスタ分析では、分析対象の要素間の距離(ユークリッド距離やマハラノビス距離など)によって分類します。
つまり、要素同士の組を一つ一つチェックした上で分類しています。
このためABC分析と比較すると、クラスタ分析の方が分類の精度が高く、ただその反面、時間がかかる傾向にあります。
冒頭で紹介したウォード法は一つ一つチェックしているがゆえ計算コストは高く、一方のk-means法は座標で計算しているため計算コストは低く抑えられています。
ここまで、クラスタ分析の分析対象は売上データとして、クラスタには客層が表れる前提で説明しております。
しかし、クラスタ分析の分析対象に特に指定はなく、商品でも従業員でも何でもかまいません。
強いて言うなら、データとして、識別コードと何らかの数値が1種類以上必要だということだけです(この基準は大抵のデータがクリアします)。
ただしデータ数によっては、例えばウォード法ではかなりの時間がかかってしまうため、注意が必要です。
よって、マスタデータの分析であればウォード法を利用し、トランザクションデータの分析であればk-means法を利用することが相応しいと言えます。
クラスタ分析の利点
商工会議所のアンケート結果を概観すると、BtoCの事業者にとっての課題の一つは集客だと言えそうです。
となれば、来店客の特徴は把握しておきたいところです。
というのも、既存客を足掛かりとしてマーケティングしていくためです。
しかし、店長や経営者が常にお客様と接し、あらゆるお客様の特徴を把握することは不可能です。
もし、システムに蓄積されたトランザクションデータをクラスタ分析できれば、手軽に顧客の特徴を明らかにすることができます。
クラスタ分析されたクラスタを調査することにより、どういった客層の顧客がどういったニーズで店舗に来店しているかを探る手掛かりとなるのです。
以下は、考えられる顧客のニーズです。
もし、クラスタ分析のような手法を利用せずに顧客を分析するとなると、商品の分析のように簡単にはいきません。
なぜなら、システムに顧客のマスタデータがないためです。
商品は、事業者側の情報のため、当然ながらマスタデータとして保存されているはずです。
対して、顧客のマスタデータを作成するとなると、顧客一人一人から個人情報を共有してもらう必要があります。
再度、来店することが前提の事業者であればそうすることは可能ですが、そうでない場合は顧客のマスタデータを作成することは容易ではありません。
そういった場合でも、クラスタ分析を利用することで顧客を客層で分類することができ、顧客を考察しやすくなります。
バスケット分析と合わせて、集客の戦略を反省する手掛かりとなるのです。
クラスタ分析の活用例
最後にクラスタ分析の活用列をいくつか挙げておきます。
文具店のホームページのリニューアル:
商店街に店舗を構える文具店にて、ホームページのリニューアルを検討しています。
できれば顧客の嗜好を取り入れたいとのことです。
そこで、どれくらい購入されたか、どのように購入されたかに焦点を当て、売上データをクラスタ分析しました。
その結果、文具を購入する顧客は、事前に購入したい顧客と、急ぎ購入したい顧客と、定期的に購入したい顧客に大別できることが分かりました。
また、客単価が比較的低い顧客が全体の約80%を占めており、一部の顧客の単価が高いということも分かりました。
前者は必要なものを購入したい顧客で、後者は購入したいものを購入したい顧客です。
この結果を踏まえ、ホームページにおけるデザインやレイアウトを検討します。
飲食店におけるクーポンの発行:
飲食店にて、定期的にクーポンを発行して、集客を試みています。
客層を意識してクーポンを発行したいため、売上データから顧客をクラスタ分析します。
今回は目的で客層を分類し調査することにしました。
当然ながら、飲食店に来店してくる顧客の目的は、飲食することです。
しかし飲食以外ではどういった目的で来店しているのか、ニーズを深く調査しました。
そうして来店人数と滞在時間に着目したところ、コミュニケーションを目的に来店してくる顧客の割合が70%以上を占めていることが分かりました。
以上を踏まえ、次回は、居心地がいいことをアピールしたクーポンを発行する方針とします。
美容院の年代限定のサービス:
美容院は基本的に新規のお客様に対して、お客様情報を登録していただくことが一般的です。
それに基づきカルテを作成し、次回の訪問の際の提案や予約を行います。
女性客が全体の70%程度で、男性客が全体の30%程度です。
また、年代は20代から30代に集中しています。
客単価は、20代よりも30代の方が高くなる傾向にあります。
このことから、10代のお客様が少ない理由の一つは単価の高さということが伺えます。
よって将来的な顧客確保のため、10代の女性のお客様限定で、特別な割引を実施する方針を検討します。