크기가 \(n\)인 샘플 \(\{x_j \}\)의 표본평균을 \(\overline{x} \), 표본분산을 \(s^2\)라 하면 \(\{ x_j \}\) 중에서 \(\overline x\)와 \(M\)이상 차이가 나는 자료는 전체 자료의 \(\dfrac {s^2}{M^2}\)보다 작다.

표본평균과 차이가 \(M\)이상인 자료의 비율을 \(\beta \)라 하면 그러한 자료는 정확히 \(\alpha = n \beta\)개가 된다. 따라서, $$ \left| x_j - \overline x \right| \geq M$$ 인 자료가 \(\alpha\)개 있게된다. 그러면, $$(n-1) s^2 = \sum_{j=1}^n \left( x_j - \overline x \right)^2 \geq \sum_{1 \leq j \leq n ,  \left| x_j - \overline x \right| \geq M} \left( x_j - \overline x \right)^2  \geq n \beta M^2$$ 그러므로 이 식을 정리해서 $$ \beta \leqslant \frac{(n-1)s^2}{nM^2} \leqslant \frac {s^2}{M^2}$$ 임을 알 수 있다.


 

크기가 각각 \(n_1\), \(n_2\)인 두 샘플의 평균을 각각 \(\overline x_1\), \(\overline x_2\), 표본분산을 각각 \({s_1}^2\), \({s_2}^2\)라 하면 두 샘플을 모아서 만든 샘플의 평균 \(\overline x\), 표본분산 \(s^2\)는 각각 다음과 같다. $$ \overline x = \frac {n_1 \overline x_1 + n_2 \overline x_2} {n_1 + n_2}, $$ $$ s^2 = \frac 1 {n-1} \left\{ \left( n_1 -1 \right) s_1^2 + \left( n_2 -1 \right) s_2^2 + \frac{n_1 n_2} n \left( \overline x_1 - \overline x_2 \right)^2 \right\}$$ 단, \(n=n_1+n_2\)이다.



이것은 연습문제 수준의 간단한 계산이므로 증명을 생략한다.


+ Recent posts