平均差
(2)度数分布の平均差 Mean difference of frequency distribution
平均差は、散布度の1種です。平均偏差とは違います。データの中の2つの単位の値の差の 絶対値を、全データに亙って総平均したものです。
平均差は、概念の上で標準偏差や平均偏差より2倍ほど大きい水準と考えます。そのため、 平均差を平均によって相対化するときは、平均差の半分を平均で割ります。これは相対平 均差ですが、Gini(ジニ)の集中係数とも呼ばれます。
この集中係数は、0に近いほど集中度が高いので、尺度の解釈に注意を要します。 ---------------------------------------- 計算例
F氏宅の60日間の電話の呼数の分布が、次表の通りのとき、1日の呼数の平均差などを求 めます。
1日の呼数 X 日数 f 0 5 1 8 2 10 3 12 4 9 5 7 6 4 7 3 8 1 9 1       ------------------- 計 60
先ず、K=10, 総度数は F=60, Xの平均はμ=3.283'、標準偏差はσ=2.0983459 となります。次にΣfifj|Xi-Xj|,(i<j)を求めると
5*8*|0-1|+5*10*|0-2|+5*12*|0-3|+5*9*|0-4|+...(10*9/2=45個の積和)=4255
となるので、 平均差は
2*4225/{60(60-1)}=2.3870 (呼)
となります。これを平均の2倍で割ると、ジニの集中係数となり、
2.3870/(2*3.283')=0.3635
となります。  
---------------------------------------- 理論
変数とその度数が
X1, X2,...., XK f1, f2,...., fK
と表わされているとします。 度数分布表が、幅のない階級からなっているときは、Xiをそのまま計算に使います。 度数分布表が、幅のある階級からなっているときは、Xiは階級の代表値とします。 の平均差をDmで表わすと
Dm=Σfifj|Xi-Xj|/{F(F-1)} (1) Fは各fiの合計。 Σは異なる i,j について、1〜K の合計をとる意味。
です。この式は、
Dm=2*Σfifj|Xi-Xj|/{F(F-1)} (2) Σは i<j となる i,j について、1〜K の合計をとる意味。
と変形することができます。なお、平均をμとし、
Dm/(2*μ)
を Gini(ジニ) の集中係数といいます。これは、相対平均差です。 ---------------------------------------
平均差の意味と計算手順のまとめ

意味:散布度の1種

計算手順:1、階級数 K, 総度数 F を確かめる。
2、式(2)を用いるとして、2つの異なる値(階級の代表値) を差の形で列挙する。列挙個数は全部で K(K-1)/2 個。(組合せの数)
3、これらの差の絶対値をとり、fifjを掛けて合計し、F(F-1)/2で割る。

------------------------------------------ 練習問題
次表は、ある果樹園から1季節に出荷された桃の重さ(g)の分布です。 桃の重さの平均差などを求めなさい。(階級は、以上−未満)
       階級  代表値  個数      160g-170g 165g   93 170 -180 175 165 180 -190 185 252 190 -200 195 318 200 -210 205 355 210 -220 215 293 220 -230 225 176 230 -240 235 132 240 -250 245 84 ------------------------------ 計 - 1868
[答 平均差 23.1095(g)、ジニの集中係数 0.05683] 参考:同じデータの平均 203.3298(g)、標準偏差 20.4027(g)、変動係数 0.1003

統計計算例集目次