新卒アナリストの徒然草

新卒アナリストが少しずつ知識を蓄えていく様をお伝えできれば…

Excelでここまで分析できるのか!①単回帰分析

Excelの実力 for 分析

分析ツールは世にたくさんありますが、

実はExcelもなかなかやりおるのです。

そんなExcelの実力を何回かに分けて紹介していきます。

 

今回は簡単なところから…

単回帰分析

について話したいと思います。

 

単回帰分析とは

2つの要素の関係がどういった具合かを調べます。

例えば「来客数」×「商品の販売数」など。

f:id:chadyuu:20140721140933p:plain

散布図を見てみると…

f:id:chadyuu:20140721140956p:plain

 これを見ただけでは?????だと思うので、

より詳しく見てみましょう。

 

まずはExcelでの単回帰分析のやり方

Excelのデータタブから

データ分析

を選んで…

f:id:chadyuu:20140721141713p:plain

→回帰分析をチョイス

f:id:chadyuu:20140721141922p:plain

Yに「売れた個数」

Xに「来客数」

を指定してあげると、、、

f:id:chadyuu:20140721141314p:plain

どどーん!!!

結果が出ました。

 

なんじゃこれ…

 

と思ったそこのあなた、

いえいえ、心配ご無用です。

見るべきポイントはたったの3つ

 

単回帰分析でみるべき3つのポイント

f:id:chadyuu:20140721142500p:plain

有意F

②係数

③重決定R2

 

1.有意F

0.05よりも小さければ、この回帰分析は正解

今回集めたサンプルデータだけではなく、

もともとの母集団においても、求めた回帰式が成り立つと仮定してよいです。

(一般的に当てはめられる、ということ)

 

今回の有意Fは8.68E-05…

んん???????

 

○Eとは

10を何乗した値か?を表します。

E-05=10の-5乗=1/100,000

E+05=10の5乗=100,000

例えば1.1E+03 = 1.1×10の3乗です。

 

今回の有意Fを改めて見てみると、

8.68E-05 = 8.68×10-5  <0.05

→この回帰分析は正しい!(母集団においても回帰式が成立)

 

  2.係数

f:id:chadyuu:20140721143946p:plain

Y=6.6885X-15.789

(Y:売れた個数、X:来客数)

という関係式が成り立つということ!

 

グラフで見ると、こんな感じ。

f:id:chadyuu:20140721144120p:plain

 

 3.重決定R2

Yをどれだけ説明できているか?(寄与率)を表します。

 

今回は

R2が0.679なので

「売れた個数」の約68%を

「来客数」で説明できたことになります。

 

一般的に

1.0≧|R|≧0.7 :高い相関がある 
0.7≧|R|≧0.5 :かなり高い相関がある ←今回はここ
0.5≧|R|≧0.4 :中程度の相関がある 
0.4≧|R|≧0.3 :ある程度の相関がある 
0.3≧|R|≧0.2 :弱い相関がある 
0.2≧|R|≧0.0 :ほとんど相関がない 

と考えます。

 

補足注意~外挿と内挿

f:id:chadyuu:20140721211618p:plain

内挿:データの最小値~最大値の間

外挿:データの最小値~最大値の外

 

外挿部分に関しては、単回帰式は数学的に信頼できない

→既存データの最小値や最大値からかけ離れた値の回帰式への代入はダメ

 

 ----------------------------------------------------------------------------------------------------

まとめ

単回帰分析は

  1. 有意F:0.05より小さければ、母集団においても成り立つ。
  2. 係数:回帰式Y=aX+bを導き出す。
  3. 重決定R2:YをXでどれだけ説明できているか

を見ればよい!

----------------------------------------------------------------------------------------------------

 

というわけで、

本シリーズ「Excelでここまで分析できるのか!」の

第一回目「単回帰分析」を終わります!

 

次回は「重回帰分析」について扱います。

マルチコ排除→変数選択→重回帰分析

までをExcelでちゃちゃっとできることを

お見せします。