平均差
(2)度数分布の平均差 Mean difference of frequency distribution
平均差は、散布度の1種です。平均偏差とは違います。データの中の2つの単位の値の差の 絶対値を、全データに亙って総平均したものです。
平均差は、概念の上で標準偏差や平均偏差より2倍ほど大きい水準と考えます。そのため、 平均差を平均によって相対化するときは、平均差の半分を平均で割ります。これは相対平 均差ですが、Gini(ジニ)の集中係数とも呼ばれます。
この集中係数は、0に近いほど集中度が高いので、尺度の解釈に注意を要します。 ---------------------------------------- 計算例
F氏宅の60日間の電話の呼数の分布が、次表の通りのとき、1日の呼数の平均差などを求 めます。
1日の呼数 X 日数 f 0 5 1 8 2 10 3 12 4 9 5 7 6 4 7 3 8 1 9 1 ------------------- 計 60
先ず、K=10, 総度数は F=60, Xの平均はμ=3.283'、標準偏差はσ=2.0983459 となります。次にΣfifj|Xi-Xj|,(i<j)を求めると
5*8*|0-1|+5*10*|0-2|+5*12*|0-3|+5*9*|0-4|+...(10*9/2=45個の積和)=4255
となるので、 平均差は
2*4225/{60(60-1)}=2.3870 (呼)
となります。これを平均の2倍で割ると、ジニの集中係数となり、
2.3870/(2*3.283')=0.3635
となります。 ---------------------------------------- 理論
変数とその度数が
X1, X2,...., XK f1, f2,...., fK
と表わされているとします。 度数分布表が、幅のない階級からなっているときは、Xiをそのまま計算に使います。 度数分布表が、幅のある階級からなっているときは、Xiは階級の代表値とします。 の平均差をDmで表わすと
Dm=Σfifj|Xi-Xj|/{F(F-1)} (1) Fは各fiの合計。 Σは異なる i,j について、1〜K の合計をとる意味。
です。この式は、
Dm=2*Σfifj|Xi-Xj|/{F(F-1)} (2) Σは i<j となる i,j について、1〜K の合計をとる意味。
と変形することができます。なお、平均をμとし、
Dm/(2*μ)
を Gini(ジニ) の集中係数といいます。これは、相対平均差です。 ---------------------------------------
平均差の意味と計算手順のまとめ
意味:散布度の1種 |