四分位と四分位偏差 (1)四分位 Quartile
変数(データ)を小さい方から並べたとき、データの数を1:3に分ける 位置の値を、第1四分位といい、普通、Q1で表わします。これに準じて、 データの数を3:1に分ける位置の値を、第3四分位といい、普通、 Q3で表わします。
第2四分位は、データを半々に分ける位置の値ですが、これは中央値と同 じです。
四分位は、データの数が少ないときは、求めにくかったり、求められない 場合があります。
四分位の所在階級
度数分布の下方から累積度数をとって、総度数の4分の1以上で、それに 最も近い累積値に当たる階級が、第1四分位のある階級です。
また、総度数の4分の3以上で、それに最も近い累積値に当たる階級が、 第3四分位のある階級です。 ------------------------------------------ 理論
第1四分位
第1四分位のある階級の下端を X1',度数を f1',幅を C1, X1'より下の度数を F1',総度数を Fとすると、 第1四分位は
Q1=X1'+C1*(F/4 -F1')/f1' (1)
となります。
第3四分位
第3四分位のある階級の下端を X3',度数を f3',幅を C3, X3'より下の度数を F3',総度数を Fとすると、 第3四分位は
Q3=X3'+C3*(3*F/4-F3')/f3' (2)
となります。 ------------------------------------------ 計算例 次表は、ある果樹園から1季節に出荷された桃の重さ(g)の分布です。 桃の重さの第1四分位と第3四分位を求めます。(階級は、以上−未満)
階級 代表値 個数 累積値 160g-170g 165g 93 93 170 -180 175 165 258 180 -190 185 252 510 190 -200 195 318 828 200 -210 205 355 1183 210 -220 215 293 1476 220 -230 225 176 1652 230 -240 235 132 1784 240 -250 245 84 1868 ------------------------------ 計 -
第1四分位のある階級は、総度数の 1/4すなわち 1868/4=467 以上で これに最も近い累積値 510に当たる 180-190 です。この階級の下端は 180、度数は 252、幅は 10、180より下の度数は 258により、桃の重さの 第1四分位は、
Q1=180+10*(467-258)/252=188.2936(g)
となります。
第3四分位のある階級は、総度数の 3/4すなわち 3*1868/4=1401 以上で これに最も近い累積値 1476に当たる 210-220 です。この階級の下端は 210、度数は 293、幅は 10、 210より下の度数は 1183により、桃の重さの 第3四分位は、
Q3=210+10*(1401-1183)/293=217.4402(g)
となります。 ------------------------------------------練習問題
意味と計算手順のまとめ 意味:データを大きさの順に並べたとき、全体を4等分する位置の値。 (第2四分位は中央値に同じ)
計算手順:1、データから N を確かめる。
2、下方から累積度数をとる。
3、第1四分位のある階級と、第3四分位のある階級を見つける。
4、第1四分位は、所在階級の下端を X1',度数を f1',幅を C1, X1'より下の度数を F1', 総度数 Fをとし、式(1)にあては めて求める。
5、第3四分位は、所在階級の下端を X3',度数を f3', 幅を C3, X3'より下の度数を F3', 総度数 Fをとし、式(2)にあては めて求める。
次の表はある地域の世帯の年間収入の分布です。 収入の第1四分位及び第3四分位を求めなさい。(階級は、以上−未満)
収入階級 世帯数 累積世帯数 0万円- 100万円 48 100 - 200 60 200 - 300 97 300 - 400 123 400 - 500 101 500 - 700 85 700 -1000 54 1000 -1500 29 1500 -2000 18 2000 -3000 6 3000 - 2 ----------------------------------------------
ヒント:先ず、累積世帯数を出し、次に2つの四分位を求めます。 [答 第1四分位 249万円 (計算値 249.2268) 第3四分位 590万円(計算値 590)]
統計計算例集目次