Excelでここまで分析できるのか!①単回帰分析
Excelの実力 for 分析
分析ツールは世にたくさんありますが、
実はExcelもなかなかやりおるのです。
そんなExcelの実力を何回かに分けて紹介していきます。
今回は簡単なところから…
単回帰分析
について話したいと思います。
単回帰分析とは
2つの要素の関係がどういった具合かを調べます。
例えば「来客数」×「商品の販売数」など。
散布図を見てみると…
これを見ただけでは?????だと思うので、
より詳しく見てみましょう。
まずはExcelでの単回帰分析のやり方
Excelのデータタブから
データ分析
を選んで…
→回帰分析をチョイス
Yに「売れた個数」
Xに「来客数」
を指定してあげると、、、
どどーん!!!
結果が出ました。
なんじゃこれ…
と思ったそこのあなた、
いえいえ、心配ご無用です。
見るべきポイントはたったの3つ
単回帰分析でみるべき3つのポイント
①有意F
②係数
③重決定R2
1.有意F
0.05よりも小さければ、この回帰分析は正解!
今回集めたサンプルデータだけではなく、
もともとの母集団においても、求めた回帰式が成り立つと仮定してよいです。
(一般的に当てはめられる、ということ)
今回の有意Fは8.68E-05…
んん???????
○Eとは
10を何乗した値か?を表します。
E-05=10の-5乗=1/100,000
E+05=10の5乗=100,000
例えば1.1E+03 = 1.1×10の3乗です。
今回の有意Fを改めて見てみると、
8.68E-05 = 8.68×10-5 <0.05
→この回帰分析は正しい!(母集団においても回帰式が成立)
2.係数
Y=6.6885X-15.789
(Y:売れた個数、X:来客数)
という関係式が成り立つということ!
グラフで見ると、こんな感じ。
3.重決定R2
Yをどれだけ説明できているか?(寄与率)を表します。
今回は
R2が0.679なので
「売れた個数」の約68%を
「来客数」で説明できたことになります。
一般的に
1.0≧|R|≧0.7 :高い相関がある
0.7≧|R|≧0.5 :かなり高い相関がある ←今回はここ
0.5≧|R|≧0.4 :中程度の相関がある
0.4≧|R|≧0.3 :ある程度の相関がある
0.3≧|R|≧0.2 :弱い相関がある
0.2≧|R|≧0.0 :ほとんど相関がない
と考えます。
補足注意~外挿と内挿
内挿:データの最小値~最大値の間
外挿:データの最小値~最大値の外
外挿部分に関しては、単回帰式は数学的に信頼できない✖
→既存データの最小値や最大値からかけ離れた値の回帰式への代入はダメ
----------------------------------------------------------------------------------------------------
まとめ
単回帰分析は
- 有意F:0.05より小さければ、母集団においても成り立つ。
- 係数:回帰式Y=aX+bを導き出す。
- 重決定R2:YをXでどれだけ説明できているか
を見ればよい!
----------------------------------------------------------------------------------------------------
というわけで、
本シリーズ「Excelでここまで分析できるのか!」の
第一回目「単回帰分析」を終わります!
次回は「重回帰分析」について扱います。
マルチコ排除→変数選択→重回帰分析
までをExcelでちゃちゃっとできることを
お見せします。