相関係数
(3)度数分布の相関係数(その2)
階級に幅がある場合
変数の一方または両方に幅をもつ階級があるときは、幅をもつ階級について階級の代表
値を設ける必要があります。階級の代表値は、普通、階級の中央値とします。
理論
幅をもつ階級について階級の代表値が設けられたとして、それを X,Y、その度数を
fとして、データを (X,Y,f)の形に整理した場合、Xと Yの相関係数の求め方は、階
級に幅がない場合の方法と同じになります。
--------------------------------------------------
計算例
あるレストランの客は、勘定単位でみると1人客と2人以上の集団客からなってい
ます。ある時期の客規模と飲食代別の来客頻度は下表のとおりです。
客規模と飲食代の相関係数を求めてみます。(飲食代の階級は「以上-未満」)
飲食代↓ 客規模→ | 1人 | 2人 | 3人 | 4-5人 | 6-9人 | 10-15人 |
---|
500-1000(円) | 2 | . | . | . | . | . |
---|
1000-1500 | 3 | . | . | . | . | . |
---|
1500-2000 | 1 | 2 | 1 | . | . | . |
---|
2000-3000 | . | 2 | 2 | 2 | . | . |
---|
3000-5000 | . | 2 | 3 | 2 | 1 | . |
---|
5000-10000 | . | 1 | . | 1 | 2 | . |
---|
10000-20000 | . | . | . | . | 1 | 1 |
---|
20000-30000 | . | . | . | . | 1 | 1 |
---|
30000-50000 | . | . | . | . | . | 1 |
---|
上表の幅のある階級を、階級の中央値に置き換えます。
飲食代↓ 客規模→ | 1人 | 2人 | 3人 | 4.5人 | 7.5人 | 12.5人 |
---|
7.5(100円) | 2 | . | . | . | . | . |
---|
12.5 | 3 | . | . | . | . | . |
---|
17.5 | 1 | 2 | 1 | . | . | . |
---|
25 | . | 2 | 2 | 2 | . | . |
---|
40 | . | 2 | 3 | 2 | 1 | . |
---|
75 | . | 1 | . | 1 | 2 | . |
---|
150 | . | . | . | . | 1 | 1 |
---|
250 | . | . | . | . | 1 | 1 |
---|
400 | . | . | . | . | . | 1 |
---|
上の表から、客規模を X(人)、飲食代を Y(100円)、来客頻度を fとして、データを
(X,Y,f)の形に書き出します。書き順は任意ですが、漏れや重複がないよう注意します。
(1,7.5,2) (1,12.5,3) (1,17.5,1)
(2,17.5,2) (2,25,2) (2,40,2) (2,75,1)
(3,17.5,1) (3,25,2) (3,40,3)
(4.5,25,2) (4.5,40,2) (4.5,75,1)
(7.5,40,1) (7.5,75,2) (7.5,150,1) (7.5,250,1)
(12.5,150,1) (12.5,250,1) (12.5,400,1)
階級に幅がない場合の計算式(参照ページ)を用いるため、次の6個の値を算出します。
F(fの計),ΣfiXi,ΣfiYi,ΣfiXi2,ΣfiYi2,ΣfiXiYi
計算してみると
F=32, ΣfiXi=135.5, ΣfiYi=2092.5, ΣfiXi2=939.25,ΣfiYi2=370856.25,
ΣfiXiYi=16460
これらにより、求める相関係数は
ρ=(32*16460-135.5*2092.5)/√{(32*939.25-135.52)*(32*370856.25-2092.52)}
=0.8217
となります。なお、Y の値は桁が多いので、Y の各値を100で割って計算しまし
たが、掛け戻す必要はありません。
----------------------------------------------
相関係数の意味と計算手順のまとめ
意味:2変数の直線的関係の強さを表わす尺度。
計算手順:1、データの配列を確かめる。
2、次の6つの値を求める。
F,ΣfiXi,ΣfiYi,ΣfiXi2,ΣfiYi2,ΣfiXiYi
3、これらを「度数分布の相関係数(その1)」
の式 (2)にあてはめる。 |
練習問題
統計計算例集目次