Webマーケティングにおいては統計解析の重要性が日増しに高まっています。Webサイトやアプリの閲覧・操作・購買の履歴が簡単に取得できるようになったため、企業にはユーザーの行動に関するデータが大量に蓄積されるようになったのです。この大量のデータは人手で処理するのが不可能なほど膨大なので、統計解析により意味のある知見を抽出する必要が出てきました。そして、データの種類や解析の目的によって、いくつかの解析手法が提案されています。本記事では、主要な統計解析の手法を紹介します。
統計解析の目的と種類

統計解析でWebマーケティング施策の成果向上を図る
インターネットでの広告宣伝が主体になると、勘や経験ではなく、データに基づいた定量的な施策を取れるようになりました。AmazonやYouTubeでコンテンツの推薦が行えるようになったのも、自分や他のユーザーの行動履歴をもとに統計解析を行っているからです。また、Webサイトに提示するボタン一つをとっても「赤色のボタンは青色よりも購買に至る成約率が高い」といった知見があれば、ユーザーにとってより満足度の高いWebサービスを構築できるようになります。
「教師あり学習」と「教師なし学習」
統計解析には大きく分けて二種類あり、「教師あり学習」と「教師なし学習」に分かれます。「教師あり学習」とは既存のデータから未知のデータを予測する手法です。例えば、過去のユーザーがアプリの利用を止めてしまった場合の利用パターンを“教師”として蓄えておき、現在のユーザーが今後利用を止めてしまうかどうかを判断することを目指します。離脱しそうなユーザーにはキャンペーンなどで利用を促進する対策を講じることができるので、Webマーケティングの観点からは重宝されます。
一方で、「教師なし学習」の目的はデータの特徴を理解する点にあります。過去の購買履歴から“クラシック音楽が好きなグループ”と“ポップスが好きなグループ”に分類し、グループ別のマーケティング施策を提案するような活用方法が考えられます。
主要な統計解析手法5選
回帰分析:数値を予測する

「教師あり学習」の中でも売上高やユーザー数のような数値の予測に利用されるのが回帰分析です。例えば、売上高は客数と客単価の組み合わせであることから、売上高を単価の高いヘビーユーザー数と単価の低いライトユーザー数から売上高の予測を目指す分析が考えられます。数式にすると「売上高=w1*ヘビーユーザー数+w2*ライトユーザー数」と表現することになるでしょう。そして、過去のデータを“教師”として解析を行いw1とw2の値を推定します。W1とw2の値が明らかになれば、今後ヘビーユーザーとライトユーザーの数が変動した際に、売上高を推定できるようになるのです。
サポートベクターマシン:カテゴリを予測する

回帰分析は数値を予測する「教師あり学習」でしたが、サポートベクターマシーン(SVM)はカテゴリを予測する分析手法です。前述の例のように“離脱しそうなユーザー”と“継続利用しそうなユーザー”といったカテゴリを分けることを目指します。例えば、直近の利用頻度や購買額などを“教師”データとして使用し、うまくカテゴリを分けられるような分類基準を見出すよう計算を行います。分類基準の精度が高ければ高いほど、新たなユーザーの行動予測が正確に行えることになるのです。
クラスタリング:似た者同士をまとめる

サポートベクターマシーンは過去のデータに基づき新たなデータを正確に分類することを目指しました。しかし、そもそもどのような特徴に基づいて、いくつのグループに分ければ良いのか分からないケースも存在します。その場合に利用されるのが「クラスタリング」の手法です。クラスタリングは「教師なし学習」の一種であり、データの分類を行います。
クラスタリングは「似た者同士をまとめる」分析手法です。例えば、ニュースサイトの閲覧履歴を分析してみると「スポーツと経済を閲覧している人たち」や「ファッションと芸能を閲覧している人たち」といったグループが見つかるかもしれません。意外な傾向を示すグループ分けが発見できると、直感に頼らない定量的な分析による新たなユーザー像を導き出すことにつながります。
主成分分析:データを要約する

クラスタリングでは似た者同士をまとめましたが、例えば、ニュースサイトでスポーツ・経済といったトピックが100種類もあったら、どうなるでしょう。「スポーツ・経済は好きで、ファッションと芸能は嫌いで、国際とギャンブルは好きで・・・」と100種類のトピック全てを羅列しなければ、一つのグループの特徴を記述できないことになります。この煩雑さを回避する方法が主成分分析です。
主成分分析は多くの変数を少ない変数に集約する手法です。「スポーツ記事の閲覧回数」「経済記事の閲覧回数」といった変数を、まとめて一つの変数にすることで、クラスタリングやデータの可視化を簡単にできます。
アソシエーション分析:相関を見出す

「ビールとオムツをまとめ買いする客が多いので、オムツの横にビールを陳列すると売り上げがあがる」というシナリオはアソシエーション分析、あるいはバスケット分析の代表例です。Webマーケティングにおいては商品推薦システムやまとめ買い(クロスセル)推進キャンペーンなどでの活用が期待されています。
アソシエーション分析では、「Aという条件の時にBが起こる確率」を計算します。数百種類ある小売商品の中から、“ビールを買った人はオムツを買う確率が高い”といった関連性を見出します。Webマーケティングにおいては“スポーツ記事を読んだ人は経済記事を読む確率が高い”といった行動パターンの理解に活用されています。
Webマーケティングでは定量的な意思決定を行うため統計解析が欠かせません。PythonやRといったプログラミング言語を学ぶと、自分でアイデアをもとにデータの分析を行うことができます。最近は簡単に統計解析が行えるようなツールが提供されているので、統計解析プログラミングの敷居が下がりつつあります。