앞선 글에 이어서 대응쌍을 이루는 이항형 반응변수에 대한 주변동질성 검정법을 더 살펴보고자 한다.
n* = n12 + n21 가 두 칸의 도수합이라고 하면, 이렇게 두 개로 나뉘는 것은 binomial variate이기 때문이다.
귀무가설 H0 : π12 = π21 하에서 n* 관측값이 n12와 n21가 될 확률은 1/2이다.
따라서 n12와 n21는 "성공횟수"와 "실패횟수"로, n* 번 시행일 때 성공의 확률이 1/2인 이항분포를 따른다.
n*이 10보다 클 때, 이 이항분포는 평균과 표준편차가 다음과 같은 정규분포와 비슷하게 된다.
$$ mean=\frac{1}{2}n^{*}, sd = \sqrt{n^{*}(\frac{1}{2})(\frac{1}{2})} $$
따라서 표준화된 정규분포의 검정통계량은 다음과 같다.
$$ z=\frac{n_{12}-(\frac{1}{2})n^{*}}{\sqrt{n^{*}(\frac{1}{2})(\frac{1}{2})}} = \frac{n_{12}-n_{21}}{\sqrt{n_{12}+n_{21}}} $$
앞선 글에서 사용했던 표를 다시 가져와서 이 검정통계량에 대입해보면
Belt-Tightening | |||
---|---|---|---|
Higher tax | Agree | Disagree | Total |
Agree | 227 | 132 | 359 |
Disagree | 107 | 678 | 785 |
Total | 334 | 810 | 1144 |
n12는 132, n21는 107이므로, 검정통계량 z는 다음과 같다.
❗ 앞서 사용한 표를 다시 가져와 종속인 두 비율의 차이에 대한 추정에 대해 얘기하고자 한다.
Belt-Tightening | |||
---|---|---|---|
Higher tax | Agree | Disagree | Total |
Agree | 227 | 132 | 359 |
Disagree | 107 | 678 | 785 |
Total | 334 | 810 | 1144 |
증세에 "예"라고 대답할 확률은 P(Y1=1), 긴축에 "예"라고 대답할 확률은 P(Y2=1) 이다.
이 두 비율의 차이인 P(Y1=1) - P(Y2=1)에 대한 신뢰구간은 유의성검정보다 더 많은 정보를 준다.
(더 많은 정보를 준다는 것은 아직 잘 이해가 안간다.)
P(Y1=1)=π11+π12이며, P(Y2=1)=π11+π21 이므로 이 두 비율의 차이는 π12-π21 이다.
댓글
댓글 쓰기