集団の部分と全体の関係
(4)全分散、外分散、内分散、分散比
理論
1つの集団を、幾つかの部分集団に分けると、外分散σb2と内分散σw2が生じますが、 これらと全分散σ2との間には関係があり、
σ2b2w2 (1)
となります。これにより、部分集団ごとの平均と分散が分かっていれば、   元の個別データを知らなくても、全分散は求められます。
上のことは、全分散が外分散と内分散に分けられることを示しています。
 上のことは、初めに集団が幾つかあって、それらを併合して全集団とする   場合も同じです。

分散比
外分散と内分散を用いて
F={(N-K)σb2}/{(K-1)σw2} (2)
という指標を作ると、この Fは部分集団の平均のばらつきを一層顕著に示す ものとなります。
部分集団を作るとき、各部分集団の平均にあまり差がないようにすると、 Fの値は1より小さくなる向きとなります。
部分集団を作るとき、各部分集団の特性に特別の考慮を払わないような場合は、 Fの値は1に近い向きとなります。
部分集団を作るとき、各部分集団の平均に差をつけようとすると、 Fの値は1より大きくなる向きとなります。
Fのこれらの性質により、Fの値は、部分集団の間の異質性の尺度として   利用することができます。
部分集団が、正規分布から抽出された標本からなるとき、Fの値は 自由度 K-1,N-Kの F分布をします。 ------------------------------------- 計算例
ある市に4つの高校があり、同じ学年で同じ問題の統一試験が行われました。 学校別の生徒数と点数の分散などは次の通りです。4校の内分散、外分散、 全分散、Fの値を求めてみます。
学校(i)
生徒数(Ni)13519092156
平均点(μi)73678574
分散(σi2)278137220463
既に算出してある σb2=35.286, σw2=272.300により σ2=307.586, さらに N=573, K=4により
F=(573-4)*35.286/{(4-1)*272.3}=24.578
となって、学校間でかなりの差がみられます。
------------------------------------- 練習問題
ある農家では、収穫したじゃが薯を袋詰めにして販売するのに、  袋ごとに薯の大きさを揃えて、消費者の求めに応じることにしています。  次の表は、5袋の薯の重さを示しています。  薯の重さについて、内分散、外分散、全分散の関係を確かめるほか、  Fの値を求めなさい。
袋(i)重さ(g)
158165171........
125120134118.......
102107958996......
70756769657471....
3738455146374347495445
ヒント:別の計算により σb2=1505.182, σw2=27.442, σ2=1532.623     により、上の(1)式が成り立つことを確かめます。 次に、N=30, k=5などから(2)式により Fを求めます。
F=342.815 となり、1より非常に大きいので、袋への仕分けがよく     できているといえます。ただし、ここでは正規分布を基礎としてい ないので、F分布表の使用や確率的な検討はできません。 


統計計算例集目次