アソシエーション分析とは、顧客の購買履歴やパターンを分析するデータ分析手法です。マーケティング施策で使われることが多く、商品同士の関連性や同時性を見つけるのに有益といわれます。
例えば「オムツを購入する人はビールも一緒に購入する傾向にある」というエピソードを耳にしたことはありませんか?
これは「一見無関係なように見える商品同士でも意外な関連性が見つかる」という、アソシエーション分析の好例です。
当記事では、アソシエーション分析の概要やデータマイニングとの関係・実施方法、注意点や事例まで紹介します。
この機会にアソシエーション分析の理解を深めてください!
このページの目次
アソシエーション分析とは、データマイニングの分析方法の一つです。If「もしこうだったら」Then「こうなる」と仮定し、事象間の関連性を探ります。
主に購買行動の関連性を把握するために利用される手法ですが、多様なシーンで活用可能です。アソシエーション分析とはどのようなものなのか、具体的に見てみましょう。
アソシエーション分析を使えば、ユーザーが購入する商品やサービスの関連性を見つけ出しやすくなります。
例えばスーパーなどで「○○を購入した人は何を一緒に購入する確率が高いのか」ということもアソシエーション分析で推測できます。
そもそもアソシエーション分析とは店舗のPOS(point of sales)データを解析するために開発された手法です。そのため量販小売業のマーケティング施策などで特に有益といわれます。
POSレジのデータなどには「販売数」「販売時間」「実際に売れた商品」などが記録されています。これらのデータを見れば、どの商品がよく売れているかを把握するのは難しくありません。
しかし、データを見ただけでは「どの商品の組み合わせが多かったのか」といった商品の関連性まで把握するのは困難でしょう。
ところがアソシエーション分析を行えば、商品の相関性を数値で把握することが可能です。
アソシエーション分析では「アソシエーションルール」を抽出して評価します。アソシエーションルールとは、同時性や関連性の高い事象同士の相関関係のことです。
「ある事柄が発生すると、それに関連して別の事象も発生する」というような連動性のある組み合わせを指します。
例えば小売業などであれば「サンドイッチを購入する人はコーヒーも一緒に購入する」というアソシエーションルールが見つかるかもしれません。
この「もし○○ならば△△である」「○の条件ならば△△が起こる」というルールの抽出ができれば、マーケティング上大きなメリットとなり得ます。
アソシエーション分析と同義的に使われるのが「マーケットバスケット分析」です。POSデータやECサイトの取引データを分析し、「顧客が購入する商品の組み合わせ」を抽出します。
アソシエーション分析の代表としてよく引き合いに出されますが、必ずしも「アソシエーション分析=マーケットバスケット分析」とは言えません。
アソシエーション分析は小売業以外の場所でも活用される一方、マーケットバスケット分析の対象はピンポイントに「購買行動」です。
マーケットバスケット分析はアソシエーション分析と同義というよりは、その一部であるといえるでしょう。
アソシエーション分析は、小売店のレイアウトや商品陳列の方法などに活用されることが多いでしょう。
特に有名な活用例として知られるのが先述した『オムツとビール』です。
アメリカの小売業者がアソシエーション分析を行った際、「オムツを購入する人はビールを併せて購入している」というデータが出たそうです。
この結果を受けて店舗はオムツの側にビールを配置。すると、店の売り上げがアップしたと言われています。
このアソシエーション分析の結果については「子育て中の男性がオムツを購入するとき、自分へのご褒美としてビールを購入していく」といった仮説が立てられましたが、この話の真偽は不明です。
しかし、アソシエーション分析の結果に合わせて商品を並べて配置したりレイアウトを変更したりするのは店舗の業績アップには有益であると考えられます。
アソシエーション分析はデータマイニングの手法の一つですが、そもそもデータマイニングとはどのようなものなのでしょうか。
アソシエーション分析についてより深く知るために、データマイニングについても知見を深めておきましょう。
データマイニング (Data mining)=データを採掘すること
データマイニングとは、多くの情報を分析し必要な情報を抽出することを指します。
データを「鉱山」、そこにある未知の情報や法則を「貴重な鉱石」に見立て、必要な情報を見つけることを「採掘(マイニング)」に例えました。
特に昨今では、ビッグデータの扱いが売上や企業の発展に大きく影響するといわれています。
多種多様かつ膨大なデータから有益な情報を抽出する手段として、データマイニングはさまざまな業界から注目を集めています。
データマイニングの手法はさまざまあり、アソシエーション分析もその一つです。このほか、以下のような手法が主に使用されます。
クラスター分析とは、顧客セグメントを作成する際に多用される手法です。調査の対象をクラスター(集団)に分け、効果的なアプローチ方法を模索します。
またロジスティク分析とは、「YESかNO」しかないデータの分析に向いている手法です。これを元にして商品を購入してくれる確率や1人当たりの予想購入数などを割り出します。
そしてABC分析は、データを重要度の高い順にランク付けして管理・分析する手法です。企業の経営戦略やマーケティングには必要不可欠で、データ分析の基本といわれます。
データマイニングの役割は、主に次の3つです。
1. データの分類:商品に興味がある層、ない層に分けたり特徴別に分けたりできる
2. 関連性の抽出:商品の共通点、売れる組み合わせなどを発見できる
3. 発生確率の予測:購入する可能性が高い人、売れる確率が高い時期、人を集めそうな商品などを予測できる
まずデータを適切に分類することで、マーケティング対象を明確に絞ることが可能です。細かな戦略が立てやすく、ターゲットに集中してアプローチできます。
また、売れる商品の組み合わせが分かれば、商品の陳列にも無駄がなくなります。時間帯や曜日ごとに売れる商品を並び替えるなどもでき、マーケティングに有益です。
さらに購入の予測ができれば、先回りして顧客にレコメンドできます。売りたい商品を買いたい人におすすめできれば、それが売上アップにつながるでしょう。
アソシエーション分析を搭載したデータマイニングツールなどを使うと、「パンとバターを購入した取引ではミルクも購入されている」といったルールは
[パン, バター]⇒[ミルク] (支持度 8%、信頼度 90%)
などと示されます。
アソシエーション分析を行うには「支持度」「信頼度」、さらに「リフト値」を求めてアソシエーションルールを導き出さねばなりません。
アソシエーション分析に必須とされる3つの指標について紹介します。
支持度=商品Aと商品Bを購入した顧客数÷全体顧客数
全データの中で「商品Aと商品Bを一緒に買う」ケースが出現する割合を表わす指標です。数値が大きいほど、その組み合わせが出現する可能性が高まります。
信頼度=商品Aと商品Bを購入した顧客数÷商品Aを購入した顧客数
「商品Aを購入した人が商品Bも購入する」割合を示す指標です。この指標の数値が高いほど、AとBの関連性が強いことが分かります。AとBの相関関係を測るときに有益です。
ただし、この数値を適切に判断するには全体をきちんと把握しておく必要があります。
例えば商品Bを購入した人が100%に近かったなら、ほとんど全ての顧客が商品Bを購入していたということです。
信頼度の数値が高いのも当然で、数値に信憑性がありません。
一方商品Bを購入したのが全体の10%程度にもかかわらず信頼度が高かったのなら、商品Aとの関連性は十分にあると考えられるでしょう。
信頼度は全体数に大きく左右されるため、この指標だけを見ていては正しい結果を得られません。
リフト値=信頼度÷(商品Bを購入した顧客数÷全体顧客数)
全データの中で、「商品Aと商品Bを購入した人の割合」が「商品Bを購入した人の割合」よりどれほど多いかを倍率で示したものです。
もしもリフト値が低ければ、商品Bは商品Aとは関係のない理由で売れていると考えられます。具体的には、リフト値が1に満たない場合は有益な指標とはなり得ないでしょう。
「支持度」「信頼度」「リフト値」でアソシエーション分析の元となるアソシエーションルールを導き出します。しかし、「信頼度」の項で述べたとおり、数値を単独で見ると有益な値とはいえないケースが少なくありません。
アソシエーションルールを求めるときは、3つの値を相互に確認しながら判断しましょう。「現場での応用が可能か」ということも念頭に置きながら、活用できそうなルールを求めるのがベターです。
アソシエーション分析によって「相関性がある」「ない」は判断できますが、その因果関係までは分かりません。アソシエーション分析はあくまでも「事実」しか見えないことは承知しておきましょう。
アソシエーション分析において、気をつけたいポイントを紹介します。
アソシエーション分析は複数のデータ間の因果関係を対象としています。前提となるデータは「条件部」、結論となるデータは「結論部」とされますが、両者が逆転することはありません。
これはどういうことかというと、例えば「商品Aを購入した人の70%は商品Bも購入している」というアソシエーション分析の結果が出たとしても「商品Bを購入した人の70%が商品Aも購入している」とはならないということです。
商品Bについて知りたいならまた改めて分析をし直す必要があります。
アソシエーション分析を行うときは、「とりあえず分析してみよう」というスタンスだと有益なデータを得にくくなります。何のためにデータを抽出するのか、調べるのかを明確にしておくことが大切です。
「データをどのような課題に当てるのか」が分かっていれば、データの当たりも付けやすくなります。ピンポイントにデータを抽出でき、よい細やかな比較検討が可能となるはずです。
アソシエーション分析をしても、必ずしも価値あるデータが見つかるとは限りません。
ごく当たり前のルールやすでに周知のルールが大量に抽出されることがあります。
またデータとして上がってきてはいるものの意味不明だったり、「なぜこのような結果が出たのか分からない」と感じたりするものもあるでしょう。
アソシエーション分析の結果を売上や購買意欲のアップに繋げるには、因果関係についての仮説を立てることが不可欠です。
「なぜそのような結果が出たのか」を現場で考察し、それを元に検証していかねばなりません。
データは数字の羅列と心得、その背後にあるものを見極めることが重要です。
アソシエーション分析の応用範囲は広いといわれます。先述した「オムツとビール」のような事例のほか、どのようなケースがあるのでしょうか。
アソシエーション分析の事例について見てみましょう。
Amazonなどで買い物すると、「この商品を買った人はこんな商品も買っています」など表示されます。
これはユーザーの購入したものをアソシエーション分析し、その結果を活用したもの。ユーザーが興味を持ちそうなものをリコメンドしているのです。
閲覧しているユーザーごとに商品は変わるため、非常に効率のよい宣伝広告といえるでしょう。
企業の運営するサイトのサービスを向上させたりアクセス数や滞在時間を延ばしたりする際も、アソシエーション分析が有益とされます。
このときアソシエーション分析の対象となるのは「ユーザーが閲覧したページの組み合わせ」「来訪時の検索キーワードの組み合わせ」などです。
これらをルール化して分析することで、より訴求力の高いサイトを構築できます。
アソシエーション分析は、情報化時代に必須のデータマイニング手法の一つです。
データを適切に抽出・解析することで、マーケティング施策に生かすことができます。小売業で「商品陳列の最適化をしたい」などと考えている経営者には大きな助けとなるでしょう。
ただし、データはあくまでも数値の羅列に過ぎません。これを生かすには因果関係を推察し現場で実証してみることが不可欠です。
アソシエーション分析を適切に活用して、売上アップにつなげましょう。
画像出典元:Unsplash、Pixabay