歪度
(1)個別データの歪度 Skewness
歪度は、データが平均の回りに対称に分布していない度合いを示す尺度です。 非対称度ともいいます。各データの平均からの偏差をもとにして測ります。
歪度は、分布について平均や分散以外の特性を知りたい場合などに利用されます。 歪度には、単位呼称はありません。 −−−−−−−−−−−−−−−− 理論
個別データを
X1,X2,....,XN
とし、これらの平均をμ、標準偏差をσとするとき、
γ1=Σ(Xi-μ)3/(Nσ3) (1) 重要注意 Σはiについて1からNまで合計する意味。
が歪度です。
なお、この式は次のようにも表すことができます。
γ1={(ΣXi3)/N-3μ(ΣXi2)/N+2μ3}/σ3 (2)
式(1)と(2)は数理的に同じで、どちらを使用しても構いません。データが多いときは、式(2)が便利です。
歪度を求めるには、予めデータ数、平均、標準偏差の値を用意する必要があります。
データが、平均を中心にして対称のときは、γ1=0 となります。 しかし、非対称でも γ1=0 となることがあるので注意を要します。
平均から右方遠くにデータがあり、左方遠くにはデータがないような分布では、歪度は正で大きくなります。 この分布を、正の非対称分布ということがあります。
平均から左方遠くにデータがあり、右方遠くにはデータがないような分布では、歪度は負で大きくなります。 この分布を、負の非対称分布ということがあります。 --------------------------------------- 計算例
個別データが
8,5,2,9,5,3,7,5
の場合、歪度を求めるに、先ず、N=8, 平均はμ=(8+5+2+9+5+3+7+5)/8=5.5 分散はσ2=(82+52+22+92+52+32+72+52)/8-5.52=5 となるので、歪度は式(1)により
γ1={(8-5.5)3+(5-5.5)3+(2-5.5)3+(9-5.5)3+(5-5.5)3+(3-5.5)3+ (7-5.5)3+(5-5.5)3}/(8*√53)=0.033541
式(2)を用いるときは、N,μ,σのほか、ΣX2,ΣX3を数値として準備する必要があります。 すなわち、データより ΣX2=282, ΣX3=1994となるので
γ1=(1994/8-3*5.5*282/8+2*5.53)/√53=0.033541
と同じ結果が得られます。 ---------------------------------------練習問題
歪度の意味と計算手順のまとめ 意味:集団の非対称の尺度
計算手順:1、データから N, μ, σ, ΣX2, ΣX3 を求める。
2、これらを上式 (2)にあてはめる。
25 世帯が住むアパートがあり、各世帯の人数は次の通りです。
3, 4, 2, 4, 6, 2, 5, 3, 2, 5, 4, 2, 3, 1, 5, 3, 4, 4, 2, 3, 2, 3, 2, 5, 4
世帯人員の歪度を求めなさい。[答 0.2285] 重要注意 歪度として、 {N/(N-1)/(N-2)}Σ(Xi-m)3/S3 (3) の式を用いているものがあります。mは平均、S2は分母が N-1の分散。Σはiについて 1からNまで合計す る意味。 この歪度は、与えられた大きさ Nの集団の歪度ではなく、この集団を等確率、独立な1群の標本とする 母集団の歪度の推定量です。併せて計算する分散の分母は N-1とします。前出の歪度と同じ名称ですが、 意味が違うので、注意が必要です。 (例)大きさ8の集団を 8,5,2,9,5,3,7,5 とするとき、この8個の前出の歪度は 式(1)により 0.033541です。 一方、この8個が、別にある母集団からの等確率、独立な標本であるとするとき、母集団の歪度は 式(3)により 0.041833 と推定されます。