データ解析(手法)
アソシエーション分析
- ・アソシエーション分析のやり方についてご説明します。
- ・手順が複雑ですので、プログラミングすることを推奨します。
- ・Excelのような機能が豊富なスプレッドシートでも分析はできますが、やり方は工夫しなければなりません。
- ・不明点あれば問い合わせください。
- ※当サイトで掲載しているデータは適当に作成したものであり、実際のものではありません。
アソシエーション分析とは
アソシエーション分析することによって、分析対象となる要素同士の関連に着目して、商品・サービスの売れ方の構造を明確化できるようになります。
ビジネスにおけるデータ分析というとABC分析が真っ先に取り挙げられますが、ABC分析に次いで紹介されるのがこのアソシエーション分析です。
1990年代IBM社によって発表されたアプリオリアルゴリズムがアソシエーション分析の原型となっています。
POS(Point Of Sales)システムの膨大な売上データから、商品間の有益な関連を発見することを目的に開発されました。
紙おむつとビールの例が有名です。
紙おむつとビールの例:
1.紙おむつとビールを同時に購入する男性客の割合が多いことを発見する
2.考察したところ、かさばる紙おむつを妻から頼まれ買い物にきた夫が、手持ち無沙汰にビールも買っていた
3.紙おむつの近くにビールを配置することで売上が向上した
このように、アソシエーション分析では、何と何が売れたかを明確化できます。
ここがABC分析との大きな違いです。
ABC分析では、何が売れたかは分かっても、何と何がどう売れたかは分かりません。
「整列」と「分類」しかしないABC分析では、商品間の関連は分析できないからです。
一方、アソシエーション分析では、商品・サービスの売れ方に着目して分析するため、どう売れたかを知ることができます。
つまり、ABC分析が「何が売れたか」を明確化することに対して、アソシエーション分析では「どう売れたか」を明確化します。
アソシエーション分析のやり方
まず、分析対象とするデータを用意します。
データには、「何」が売れたかに加えて、「何と一緒」に売れたかも記録されていなければなりません。
アソシエーション分析が、何と一緒に売れたかを分析することで売れ方を明確化する分析手法だからです。
そのようなデータの最もな例としては、店舗のPOSシステムのトランザクションデータが挙げられます。
以下にデータの例を示します。
このトランザクションデータに対して、以下のような手順で分析を進めていきます。
【手順1】トランザクションデータから同時に売れた商品の組をリスト化します。
【手順2】リストから商品単位および商品組単位で集計し頻度などを記録します。
【手順3】商品組単位で確信度を算出します。
【手順4】商品組単位で支持度を算出します。
【手順5】商品組単位でリフト値を算出します。
ここで、アソシエーション分析で代表的な3つの指標をご説明します。
確信度:
商品Aが売れたとき商品Bも売れる確率のことです。
商品Aから商品Bが売れる順序を意味しています。
以下の式で表されます。
支持度:
商品Aと商品Bが同時に売れる確率のことです。
商品Aと商品Bの全体に対する影響の度合いを意味しています。
以下の式で表されます。
リフト値:
商品Bが、商品Aから売れる度合いのことです。
商品Aから商品Bが売れる推移にどれだけ意味があるかを表しています。
以下の式で表されます。
※リフト値は、1以上で有意と判断します。
それぞれの指標が求まったところで分析は終了です。
後は、分析されたそれぞれの指標に対して、原因の考察と対応を考えていくのみです。
例えば以下のようにします。
確信度の高い商品の組:
売り場づくりやチラシづくりで、商品Aを買ったときに商品Bも買いたくなるような工夫を施します。
支持度の高い商品の組:
商品Aと商品Bがセットとなるような売り方を検討します。
リフト値の高い商品の組:
「~を買った人は~も買ってます」というように、商品のレコメンドなどに活用します。
ここでは代表的な3つの指標を取り挙げましたが、必要に応じて利用する指標は変更するようにします。
そもそもアソシエーション分析に定まった手順はなく、分析結果も手段によって変わります。
よって、とりあえず行う分析というわけではありません。
アソシエーション分析は、目的を意識し、その目的を果たすために何を知るべきか明らかにした上で実施するものです。
アソシエーション分析の特徴
アソシエーション分析することにより、分析対象の要素間の関連の強弱を特定の指標を用いて明確化できます。
これはベイジアンネットワーク(因果関係を確率で表現するグラフィカルモデル)の考え方です。
また、関連である以上、各要素同士の組み合わせで分析していかなければなりません。
当然、アルゴリズムとしての計算量は増えますし、処理が必要な以上、分析するにあたって必要な手順も多くなります。
こうしたことからアソシエーション分析は、Excelのようなスプレッドシートで簡単に実施することはできません(不可能ではありません)。
また、アソシエーション分析の考え方はベイジアンネットワークのため、分析結果をグラフ化するとなれば、そのグラフィカルなネットワークを描画しなければなりません。
もしアソシエーション分析を簡単に実施し、かつ綺麗なグラフを出力したいということであれば、専用の統計ソフトを利用する必要があります。
アソシエーション分析の利点
アソシエーション分析では、「何と何が同時に発生したか」を示すデータから、それら要素同士が発生する構造を明確化します。
もし、アソシエーション分析を利用して商品・サービスの売れ方を分析するのであれば、それら商品・サービスが他のどの商品・サービスと一緒に購入されたかを示すデータが必要です。
何の商品がいくら売れたかという商品単体のデータだけでは、アソシエーション分析はできません。
逆に言うと、同時に発生したことを示すデータさえあれば、どのような対象であってもアソシエーション分析できるということです。
一般的にアソシエーション分析は、商品・サービスの売れ方の調査のために利用されます。
しかし、分析対象が商品・サービスでなければならないということはなく、人やイベント、機械の部品や自然現象など、幅広く適用することができます。
例えば、ヒヤリハットの報告データには人と現象が記録されており、どういったときに何が発生する可能性が高いかを突き止めることができます。
その分析結果を踏まえ、だからどうするのか事前に対策を講じておけば、少しでも事故の発生を低減できるようになります。
何と何がというように、組み合わせに着目して処理するとなると、アルゴリズムの計算量は大きくなりがちです。
しかし、アソシエーション分析の場合、要素同士(何と何)の関連をチェックする方式であるため、データ量の増加に比例して計算量が爆発的に増加するということはありません。
当初から膨大なデータの分析を念頭においていたことから、アソシエーション分析はビッグデータの解析も想定した分析手法と言えます。
ゆえに、ECサイトにてユーザの購入履歴を分析し、商品・サービスの推奨をしたりするなど、ビッグデータが絡む多くの場面で活用されています。
アソシエーション分析の活用例
最後にアソシエーション分析の活用列をいくつか挙げておきます。
バラバラの商品をセットにして売る:
リサイクルショップでは様々な商品が乱立しており、相性の良い商品同士を探し出すことは難しいという背景があります。
そこで、最適な組み合わせで商品をセットで売ることはできないだろうか、と考えられました。
よって、様々な統一感のない商品をアソシエーション分析し、その結果から商品をグルーピングすることにしました。
分析しやすいようあらかじめ商品はカテゴライズしておき、カテゴリでアソシエーション分析します。
色や形、機能や類似度を参考に、商品をセットとしてまとめました。
効果的なチラシ作成:
家電店にて、定期的にチラシを作成しています。
1月~4月のチラシを作成するにあたって、何に注目すべきか調査することとなりました。
まず、1月~4月の家電製品の売れ方をアソシエーション分析し、商品の売れ方を明確化します。
その結果、引っ越しを考えている新入生や新社会人向けに、一人暮らしするにあたって最低限必要な家電製品のセットである「洗濯機」「冷蔵庫」「電子レンジ」「炊飯器」をメインとすればよいことを突き止めました。
さらに「テレビ」「パソコン」「掃除機」「ドライヤ」「扇風機」「アイロン」などへと、あれば便利な商品へ推移する構成でチラシを作成します。
飲食店におけるコース料理の設計:
飲食店にて、コース料理のコース設計を見直しているところです。
このまま現状維持とするか、商品の構成を変更するか、または、提供順を変更するか、どうすればいいか検討しているところです。
そこでまずは、商品の売れる順序をアソシエーション分析し、商品間の推移を調査します。
すでにコース料理として提供している商品の場合、食べ残しがどれだけあるかをデータとして記録しておき、このデータも分析に加えるようにします。
これらの調査結果を踏まえコース設計を思案します。