(4)2項分布の分散、標準偏差など Variance, Standard deviation, etc. of binomial distribution
変数の取りうる値が2種に限られるとき、その変数は2項分布を なすといいます。この場合の値とは、普通の数ばかりでなく、 然・否、 真・偽、 男女の別などの事象や属性も数(値)として 扱います。計算のため、着目する項に1,他の項に0を付与 します。
変数をこのように定義するとき、2項分布の平均は、着目する項の、 全体に対する比(構成比)と同じになり、普通 P で表わします。
2項分布の分散は σ2=P(1-P)、標準偏差は σ=√{P(1-P)}となります。 これは、2項分布では、平均を知れば分散や標準偏差が分かることを示しています。 -------------------------------- 計算例
ある集会に男 45人、女 35人が参加しました。変数を、参加した 各人の男女(男1,女0)の識別のために設定すると、この変 数の取る値はただ2つとなるため、この変数は2項分布となります。
変数の平均は、1(男)が 45人、0(女)が 35人ですから、
=P=(1*45+0*35)/(45+35) =0.5625
となるので、分散は
σ2=P(1-P)=0.5625*(1-0.5625)=0.2461
となります。これより、標準偏差、変動係数は、
σ=√0.2461=0.4961 CV=0.4961/0.5625=0.8819
となります。 -------------------------------- 理論
属性 A または B からなる N 個のデータがあり、変数 X が A または B を取る2項分布をなすとき、属性 A に注目し てこれに1を対応づけ、属性 B には0を対応づけるもの とします。
X が 1 を取る度数を NA、0 を取る度数を NB とすると、X の平均は、加重平均と同じ考え方で、
=(1*NA+0*N B)/N=NA/N =P (N=NA+NB)
となり、分散は σ2=(12*NA+02*NB)/N-P2 =P-P2=P*(1-P) (a) あるいは σ2=NA*NB/N2 (b)
標準偏差は σ=√{P*(1-P)} 変動係数は CV=√{(1-P)/P}
となります。 −−−−−−−−−−−−−−−−−−−練習問題
2項分布の分散の意味と計算手順のまとめ
意味:2つの項のばらつきの尺度。NAと NBの値が近いほど、 ばらつきが大きいと考える。
計算手順:1、データから N, NA, NBを求める。
2、これらを上式(b)にあてはめる。あるいは、 Pを求め、上式 (a)にあてはめる。
1800人を対象に、現内閣を支持するかどうか尋ねたところ、 756人が支持、1044人が不支持を表明しました。支持と不支持 の分散などを求めなさい。
[答 分散 0.2436, 標準偏差 0.4936, 変動係数 1.1751]