지지율, 실업률, 불량률과 같이 모집단의 비율(p)을 추정하는 문제에 대해 생각해보자.
모집단이 두 개의 배반사건(찬성, 반대)으로 구성되어 있을 때, 찬성 모비율을 p, 반대 모비율을 (1-p)라 칭한다.
$$ \widehat{p}=\frac{X}{n} , E(\widehat{p})=p, Var(\widehat{p})=\frac{p(1-p)}{n} $$
이때, 모집단에서 n개의 표본을 뽑으면 찬성자수 X는 표본수 n, 성공률이 p인 이항분포 B(n, p)를 따른다.
$$ X \sim B(n, p) $$
E(X)=np, Var(X)=np(1-p) 이므로,
$$ E(\frac{X}{n})=p, Var(\frac{X}{n})=\frac{1}{n^{2}}Var(X)=\frac{1}{n^{2}}np(1-p)=\frac{p(1-p)}{n} $$
자세한 증명은 http://www.stat.yale.edu/Courses/1997-98/101/binom.htm 를 참고하면 된다.
표본크기가 충분히 크다면 표본비율은 정규분포를 따른다.
$$ Z = \frac{\widehat{p}-p_{0}}{\sqrt{p_{0}(1-p_{0})/n}} , Z \sim N(0, 1) $$
댓글
댓글 쓰기