平均差
(1)個別データの平均差 Mean difference
平均差は、散布度の1種です。平均偏差とは違います。 データの中の2つの単位の値の差の絶対値を、全データに亙って総平均したものです。
平均差は、概念の上で標準偏差や平均偏差より2倍ほど大きい水準と考えます。そのため、 平均差を平均によって相対化するときは、平均差の半分を平均で割ります。 これは相対平均差ですが、Gini(ジニ)の集中係数とも呼ばれます。 この集中係数は、0に近いほど集中度が高いので、尺度の解釈に注意を要します。
平均差は、データに単位呼称があるときは、それと同じ呼称となります。 ---------------------------------------- 計算例
次のような5個のデータがあるとします。
2,10,5,6,12
この平均差を求めます。5個の中の2個の差の絶対値を、全データに亙って平均します。
(|2-10|+|2-5|+|2-6|+|2-12|+|10-5|+|10-6|+|10-12|+|5-6|+|5-12|+|6-12|)/10 =50/10=5
となります。一方、初めの5個の平均は 7であるので、平均差を平均をベースに 相対化すると、
5/(2*7)=0.3571
となります。 ---------------------------------------- 理論
N 個のデータ
X1, X2,...., XN
の平均差をDmで表わすと
Dm=Σ|Xi-Xj|/{N(N-1)} (1) (Σは異なる i,j について、それぞれ 1〜N の合計をとる意味)
です。この式は、
Dm=2*Σ|Xi-Xj|/{N(N-1)} (2) (Σは i<j となる i,j について、それぞれ 1〜N の合計をとる意味)
と変形することができます。なお、平均をμとし、
Dm/(2*μ)
を Gini(ジニ) の集中係数といいます。これは、相対平均差です。 ---------------------------------------
平均差の意味と計算手順のまとめ
意味:散布度の1種 |