(4)全分散、外分散、内分散、分散比
理論
1つの集団を、幾つかの部分集団に分けると、外分散σb2と内分散σw2が生じますが、
これらと全分散σ2との間には関係があり、
σ2=σb2+σw2 (1)
となります。これにより、部分集団ごとの平均と分散が分かっていれば、
元の個別データを知らなくても、全分散は求められます。
上のことは、全分散が外分散と内分散に分けられることを示しています。
上のことは、初めに集団が幾つかあって、それらを併合して全集団とする
場合も同じです。
分散比
外分散と内分散を用いて
F={(N-K)σb2}/{(K-1)σw2} (2)
という指標を作ると、この Fは部分集団の平均のばらつきを一層顕著に示す
ものとなります。
部分集団を作るとき、各部分集団の平均にあまり差がないようにすると、
Fの値は1より小さくなる向きとなります。
部分集団を作るとき、各部分集団の特性に特別の考慮を払わないような場合は、
Fの値は1に近い向きとなります。
部分集団を作るとき、各部分集団の平均に差をつけようとすると、
Fの値は1より大きくなる向きとなります。
Fのこれらの性質により、Fの値は、部分集団の間の異質性の尺度として
利用することができます。
部分集団が、正規分布から抽出された標本からなるとき、Fの値は
自由度 K-1,N-Kの F分布をします。
-------------------------------------
計算例
ある市に4つの高校があり、同じ学年で同じ問題の統一試験が行われました。
学校別の生徒数と点数の分散などは次の通りです。4校の内分散、外分散、
全分散、Fの値を求めてみます。
学校(i) | 1 | 2 | 3 | 4 |
生徒数(Ni) | 135 | 190 | 92 | 156 |
平均点(μi) | 73 | 67 | 85 | 74 |
---|
分散(σi2) | 278 | 137 | 220 | 463 |
---|
既に算出してある σb2=35.286, σw2=272.300により
σ2=307.586, さらに N=573, K=4により
F=(573-4)*35.286/{(4-1)*272.3}=24.578
となって、学校間でかなりの差がみられます。
-------------------------------------
練習問題
ある農家では、収穫したじゃが薯を袋詰めにして販売するのに、
袋ごとに薯の大きさを揃えて、消費者の求めに応じることにしています。
次の表は、5袋の薯の重さを示しています。
薯の重さについて、内分散、外分散、全分散の関係を確かめるほか、
Fの値を求めなさい。
袋(i) | 重さ(g) |
1 | 158 | 165 | 171 | . | . | . | . | . | . | . | . |
2 | 125 | 120 | 134 | 118 | . | . | . | . | . | . | . |
3 | 102 | 107 | 95 | 89 | 96 | . | . | . | . | . | . |
4 | 70 | 75 | 67 | 69 | 65 | 74 | 71 | . | . | . | . |
5 | 37 | 38 | 45 | 51 | 46 | 37 | 43 | 47 | 49 | 54 | 45 |
---|
ヒント:別の計算により σb2=1505.182, σw2=27.442, σ2=1532.623
により、上の(1)式が成り立つことを確かめます。
次に、N=30, k=5などから(2)式により Fを求めます。
F=342.815 となり、1より非常に大きいので、袋への仕分けがよく
できているといえます。ただし、ここでは正規分布を基礎としてい
ないので、F分布表の使用や確率的な検討はできません。