相関係数

 (3)度数分布の相関係数(その2)
   階級に幅がある場合
変数の一方または両方に幅をもつ階級があるときは、幅をもつ階級について階級の代表 値を設ける必要があります。階級の代表値は、普通、階級の中央値とします。
  理論
幅をもつ階級について階級の代表値が設けられたとして、それを X,Y、その度数を fとして、データを (X,Y,f)の形に整理した場合、Xと Yの相関係数の求め方は、階 級に幅がない場合の方法と同じになります。 -------------------------------------------------- 計算例
あるレストランの客は、勘定単位でみると1人客と2人以上の集団客からなってい ます。ある時期の客規模と飲食代別の来客頻度は下表のとおりです。 客規模と飲食代の相関係数を求めてみます。(飲食代の階級は「以上-未満」)
飲食代↓ 客規模→1人2人3人4-5人6-9人10-15人
500-1000(円)2.....
1000-15003.....
1500-2000121...
2000-3000.222..
3000-5000.2321.
5000-10000.1.12.
10000-20000....11
20000-30000....11
30000-50000.....1
上表の幅のある階級を、階級の中央値に置き換えます。
飲食代↓ 客規模→1人2人3人4.57.512.5
7.5(100円)2.....
12.53.....
17.5121...
25.222..
40.2321.
75.1.12.
150....11
250....11
400.....1
上の表から、客規模を X(人)、飲食代を Y(100円)、来客頻度を fとして、データを (X,Y,f)の形に書き出します。書き順は任意ですが、漏れや重複がないよう注意します。
(1,7.5,2) (1,12.5,3) (1,17.5,1) (2,17.5,2) (2,25,2) (2,40,2) (2,75,1) (3,17.5,1) (3,25,2) (3,40,3) (4.5,25,2) (4.5,40,2) (4.5,75,1) (7.5,40,1) (7.5,75,2) (7.5,150,1) (7.5,250,1) (12.5,150,1) (12.5,250,1) (12.5,400,1)
階級に幅がない場合の計算式(参照ページ)を用いるため、次の6個の値を算出します。      F(fの計),ΣfiXi,ΣfiYi,ΣfiXi2,ΣfiYi2,ΣfiXiYi
計算してみると       F=32, ΣfiXi=135.5, ΣfiYi=2092.5, ΣfiXi2=939.25,ΣfiYi2=370856.25, ΣfiXiYi=16460
これらにより、求める相関係数は ρ=(32*16460-135.5*2092.5)/√{(32*939.25-135.52)*(32*370856.25-2092.52)} =0.8217
となります。なお、Y の値は桁が多いので、Y の各値を100で割って計算しまし たが、掛け戻す必要はありません。 ----------------------------------------------
相関係数の意味と計算手順のまとめ

意味:2変数の直線的関係の強さを表わす尺度。

計算手順:1、データの配列を確かめる。
2、次の6つの値を求める。 F,ΣfiXi,ΣfiYi,ΣfiXi2,ΣfiYi2,ΣfiXiYi
3、これらを「度数分布の相関係数(その1)」 の式 (2)にあてはめる。

練習問題

統計計算例集目次