INSIGHT NOW!
オープンナレッジを加速する
ユーザ参加型ビジネスメディア
勉強会でつながるビジネスコミュニティ

相関関係と因果関係は別モノだ

安田 英久
株式会社インプレスビジネスメディア Web担当者Forum編集長
安田 英久/IT・Web
5.0
2,420
2010年7月12日 17:15

今日は、アクセス解析や統計の話を。Excelを使えばいろんなデータから相関関係を簡単に出せますが、だからといってそのデータが問題解決につながるとは限らないのです。

Excelには「CORREL」という関数があり、2つのデータ群について相関関係を簡単に出すことができます。しかし、この「相関関係」と「因果関係」を混同してしまっている例があります。統計ではごく基本的なことなのですが、基本的なことこそ大切なので、改めて解説しておきましょう。

「相関関係」とは、「ある値Aが増えた(減った)状態で、別の値Bが同様の変化を示していること」を意味します。また、ある値Aが増えた状態で別の値Bが減ることを「逆相関」といいます。

たとえば、アクセス解析データで、ある期間の訪問者数とPV数の間で相関関係を出すと、かなり高い相関性が見られるでしょう。つまり、訪問者数が増える状況では、同様にPV数も増えているのです。

また、海外&国内SEO情報で取り上げた「順位決定に与えるSEO要因比較 グーグル vs. Bing」でも、さまざまなSEO要因と順位について相関係数を示しています。

http://web-tan.forum.impressrd.jp/e/2010/06/18/8214#pickup01

上記の相関関係のデータは「訪問者数が増えればPV数が上がる」「URLにリンクしているルートドメイン名の数が多ければ多いほど検索結果での順位が上がる」という、原因と結果を表しているデータである可能性が高いでしょう。しかし、そうではない場合も多いのです。

ここで重要なのは、「相関関係」が示すのはあくまでも現象であって、必ずしも「Aが増えればBが増える」という「因果関係」を意味しているわけではないことです。

つまり、「相関性がある=因果関係がある」とは限らないのです。

アクセス解析の例でいうと、「記事に対するTweet数とアクセス数に相関性がある」ことから、Twitterでスパムアカウントを大量に作成して各アカウントでtweetしまくったり、自分のTwitterアカウントで大量に記事へのリンクをtweetしたりしても、おそらくアクセス数はさほどは上がらないでしょう。幅広いアクセスを得るには、見てもらえているTwitterアカウントで、フォロワーが興味をもつ内容のコンテンツをtweetする必要があるのは、Web担当者ならわかることです。

少しアクセス解析から離れて例を示しましょう。

仮に、子供の成績と、その親が持ち家を所有しているかどうかに高い相関性がみられたとします。では、親が持ち家を購入すれば子供の成績が上がるのでしょうか? おそらく、この相関性は、「親が持ち家を購入できるくらい裕福であれば、子供の教育費も比較的多く使い、良い教育を受けさせているから子供の成績が上がる」という関係ですので、親がどれだけがんばって持ち家を購入しても、教育費を増やさなければ子供の成績は上がらないでしょう(あくまでも、これは説明のための仮の例ですよ)。

また、ビアホールの入場者数と気温の高さには相関性があるからといって、無料券を大量にバラまいてビアホールに人を多く呼び寄せたとしても、気温が上がるわけではないのは当然でしょう。

Ads by Google

ユーザ登録

無料のユーザ登録でWeb2.0時代のビジネスメディアを使いこなそう!

読者ユーザ登録
ビジョナリー会員登録
パスワードをお忘れの方

携帯でもINSIGHT NOW!