A new theory of negative variance     To Japanese
In inductive statistics it is known that values of estimator of variance can be negative.
Here we, however, show a theory of negative variance in descriptive statistics.
First we show an ordinary case. The definition of variance is σ2=Σfi(Xi-μ)2/Σfi, where
Σ is sum from i=1 to r, μ=ΣXi/Σfi , fi is the frequency of Xi . Usually fi≧0, and σ2≧0.

1. New concept
By recognizing negative frequency, if negative frequency occurs for some i, then σ2 can
be negative. In case Σfi=0, σ2 has no value. If σ2<0, σ has imaginary number.

2. Example of negative frequency
First we show ordinary data as follows and calculate the values.
i=1〜5, r=5, Xi=1,5,4,7,8. Each fi=1, Σfi=5. Then
μ=(1+5+4+7+8)/5=5, σ2={(1-5)2+(5-5)2+(4-5)2+(7-5)2+(8-5)2}/5=6
After the calculation if we found the third value X3=4 is to be deleted, we add X6=4, f6=-1,
whose frequency is negative. And we calculate again as i=1〜6, r=6.
The values are μ={1*1+1*5+1*4+1*7+1*8+(-1)*4}/(5-1)=5.25 and
σ2={1*(1-5.25)2+1*(5-5.25)2+1*(4-5.25)2+1*(7-5.25)2+1*(8-5.25)2+(-1)*(4-5.25)2}/
(5-1)=7.1875
These values are equal to those from the corrected data i=1〜4, r=4, Xi=1,5,7,8. Each fi=1,
Σfi=4. Negative existence(f6=-1, X6=4) deletes positive existence(f3=1, X3=4).

3. Example of negative variance
Let a set of data be i=1〜5, r=5, Xi=1,5,4,7,8. f1=-1, f2〜5=1
The values are μ={(-1)*1+1*5+1*4+1*7+1*8}/(-1+1+1+1+1)=7.666...,
σ2={(-1)*(1-7.666...)2+1*(5-7.666...)2+1*(4-7.666...)2 +1*(7-7.666...)2
+1*(8-7.666...)2}/(-1+1+1+1+1)=-7.777...

4. Application of negative variance
Let S2 be a sample variance drawn from a population with negative existence. Since S2
has varying denominator, the expectation of S2 is obtained by the theory of the ratio
estimation. The theory is developed by this.

References
(Japanese version) Y.Funatsu(2000) A new theory on negative variance. ESTRELA, September
    2000, Sinfonica, No.78, pp34-45.
(Japanese version) Y.Funatsu(2001) New statistical aggregate(1). Bulletin of economic studies,
    Meisei university, No.32, pp1-9.
(Japanese version) Y.Funatsu(2001) New statistical aggregate(2). Bulletin of economic studies,
    Meisei university, No.33, pp1-20.



To English
負の分散に関する理論
推測統計において、分散の推定量の実現値が負になりうることは知られている。
ここでは、これに対して記述統計における負の分散について述べる。
初めに普通の場合を示す。分散の定義は σ2=Σfi(Xi-μ)2/Σfi
Σはi=1〜rの計、μ=ΣXi/Σfi、 fiはXiの度数。 通常fi≧0 により σ2≧0 である。

1、新しい概念
負の度数を認識すると、ある i においてfi<0 となることがあり、 σ2<0 が生じる。
Σfi=0 で値なし。σ2<0 なら σは虚数となる。

2、負の度数の例
先ず通常の実在データで、i=1〜5, r=5、Xi=1,5,4,7,8、各fi=1, Σfi=5 として
計算をする。
μ=(1+5+4+7+8)/5=5, σ2={(1-5)2+(5-5)2+(4-5)2+(7-5)2+(8-5)2}/5=6
ここで X3=4 を除外すべきことに気付き、新たに X6=4, f6=-1 と負の度数
を追加し, i=1〜6、r=6 として再計算する。
Xi=1,5,4,7,8,4(i=1〜5 に対してfi=1, i=6に対してf6=-1, Σfi=5-1=4 )により
μ={1*1+1*5+1*4+1*7+1*8+(-1)*4}/(5-1)=5.25,
σ2={(1*(1-5.25)2+1*(5-5.25)2+1*(4-5.25)2+1*(7-5.25)2+1*(8-5.25)2
+(-1)*(4-5.25)2}/(5-1)=7.1875
この結果は訂正後のデータ i=1〜4, r=4, Xi=1,5,7,8. 各fi=1, Σfi=4 のものに一致する。
6番目の値4は存在が負であり、実在の3番目の値4を消去する意味がある。

3、負の分散の例
i=1〜5、r=5 とし、Xi=1,5,4,7,8、f1=-1, f2〜5=1 とすると
μ={(-1)*1+1*5+1*4+1*7+1*8}/(-1+1+1+1+1)=7.666...,
σ2={(-1)*(1-7.666...)2+1*(5-7.666...)2+1*(4-7.666...)2 +1*(7-7.666...)2
+1*(8-7.666...)2}/(-1+1+1+1+1)=-7.777...

4、負の分散の応用
負の存在を含む母集団からの確率抽出による標本分散をS2とすると、S2は分母が
確率変動するため、 その期待値は比推定の理論で求められる。これによって理論が
幅広いものになる。

参考文献
船津好明「負の分散について」ESTRELA No.78 2000年9月号 34−45頁 (財)統計情報研究
  開発センター
船津好明「新統計集団論(1)」明星大学経済学研究紀要第32巻第1・2号、1-9頁、2001年3月
船津好明「新統計集団論(2)」明星大学経済学研究紀要第33巻第1号、1-20頁、2001年12月