平均差
(1)個別データの平均差 Mean difference
平均差は、散布度の1種です。平均偏差とは違います。 データの中の2つの単位の値の差の絶対値を、全データに亙って総平均したものです。
平均差は、概念の上で標準偏差や平均偏差より2倍ほど大きい水準と考えます。そのため、 平均差を平均によって相対化するときは、平均差の半分を平均で割ります。 これは相対平均差ですが、Gini(ジニ)の集中係数とも呼ばれます。 この集中係数は、0に近いほど集中度が高いので、尺度の解釈に注意を要します。
平均差は、データに単位呼称があるときは、それと同じ呼称となります。 ---------------------------------------- 計算例
次のような5個のデータがあるとします。
2,10,5,6,12
この平均差を求めます。5個の中の2個の差の絶対値を、全データに亙って平均します。
(|2-10|+|2-5|+|2-6|+|2-12|+|10-5|+|10-6|+|10-12|+|5-6|+|5-12|+|6-12|)/10 =50/10=5
となります。一方、初めの5個の平均は 7であるので、平均差を平均をベースに 相対化すると、
5/(2*7)=0.3571
となります。
---------------------------------------- 理論
N 個のデータ
X1, X2,...., XN
の平均差をDmで表わすと
Dm=Σ|Xi-Xj|/{N(N-1)} (1) (Σは異なる i,j について、それぞれ 1〜N の合計をとる意味)
です。この式は、
Dm=2*Σ|Xi-Xj|/{N(N-1)} (2) (Σは i<j となる i,j について、それぞれ 1〜N の合計をとる意味)
と変形することができます。なお、平均をμとし、
Dm/(2*μ)
を Gini(ジニ) の集中係数といいます。これは、相対平均差です。 ---------------------------------------
平均差の意味と計算手順のまとめ

意味:散布度の1種

計算手順:1、データ数 N を確かめる。
2、上式(2)を用いるとして、2つの異なる単位のデータを 差の形で列挙する。 列挙個数は全部で N(N-1)/2 個。(組合せの数)
3、これらの差の絶対値をとり、合計し、N(N-1)/2で割る。

------------------------------------------ 練習問題
10 世帯が住むアパートがあり、各世帯の人数は次の通りです。
3, 4, 2, 4, 6, 2, 5, 3, 2, 5
世帯人員の平均差を求めなさい。 [答 平均差 1.68'(人)、ジニの集中係数 0.2346] 参考:同じデータの平均 3.6(人)、標準偏差 1.3565(人)、変動係数 0.3768

統計計算例集目次