相関係数 (1)個別データの相関係数
相関係数は、2つの変数の直線的関係の程度を測る尺度で、普通、ρ(ロー)で表わ します。 直線的でない関係は、この相関係数では測れません。 相関係数は、常に -1 と +1 の間にあります。 相関係数には、単位呼称はありません。
相関関係は、因果関係とは別です。データの内容によって、因果関係として捉えて よい場合もあるし、そうでない場合もあります。
理論
相関係数は、2つの変数 X と Y の積和を核として、X の平均と標準偏差、 Y の平均と標準偏差を組み合わせて求めます。
個別データは、(Xi,Yi)の形で与えられます。
ρ=Σ(Xi-μX)(Yi-μY)/(NσXσY) (1) ここに Σは iについて 1から Nまで計をとる記号 Nはデータの数、 μXは Xの平均、μYは Yの平均、 σXは Xの標準偏差、σYは Yの標準偏差
相関係数は、計算の便宜のため、次の式によることもできます。
ρ={NΣXiYi-ΣXiΣYi}/ √[{NΣXi2-(ΣXi)2}{NΣYi2-(ΣYi)2}] (2)
式(1)と(2)は数理的に同じで、どちらを使っても構いません。 実務では式(2)が便利です。
相関係数は、変数に一定数を加減しても、変わりません。また、 0でない一定数で乗除しても、符号を除いて変わりません。 符号は、負で乗除した回数が奇数のときだけ、変化します。 ------------------------------------- 計算例
8人の学生の身長 X(cm)と体重 Y(kg)のデータが (X,Y)の形で有ります。 (2)式を用いて身長と体重の相関係数を求めます。
(168,60) (162,55) (171,65) (159,60) (166,57) (175,61) (176,66) (168,56)
(2)式を用いる場合、次の6個の値を算出する必要があります。 N,ΣXi,ΣYi,ΣXi2,ΣYi2,ΣXiYi
計算してみると N=8, ΣXi=1345, ΣYi=480, ΣXi2=226371, ΣYi2=28912, ΣXiYi=80806
これらにより ρ=(8*80806-1345*480)/√{(8*226371-13452)*(8*28912-4802)} =848/1319.44231=0.6427
となります。 --------------------------------------練習問題
相関係数の意味と計算手順のまとめ
意味:2変数の直線的関係の強さを表わす尺度。計算手順:1、データの配列を確かめる。
2、次の6つの値を求める。 N,ΣXi,ΣYi,ΣXi2,ΣYi2,ΣXiYi
3、これらを上式 (2)にあてはめる。
次のような (X,Y) 型のデータがあります。Xと Yの相関係数を 求めなさい。
(8,0) (2,-5) (11,5) (-1,0) (6,-3) (15,1) (16,6) (8,-4)
(注)このデータは、上記の計算例のデータにおいて、Xから160 を引き、Yから60を引いたものです。相関係数は上記の計 算例と同じになります。 ヒント:式(2)を用いるとして、N,ΣXi,ΣYi,ΣXi2,ΣYi2,ΣXiYi を算出します。 (答)ρ=0.6427