두 표본이 있다.
한 표본의 개체와 다른 표본의 개체가 짝지어진 경우의 범주형 반응변수를 비교하고 싶을 때,
두 표본의 반응변수들을 대응쌍(matched pairs)이라 한다.
대응쌍의 예시로는
1) longitudinal 연구에서 동일한 대상을 시간의 흐름에 따라 반복적으로 관측하는 경우.
- ex. 식습관을 바꾸기 전의 체중과 바꾼 후의 체중
2) 같은 범주를 갖는 유사한 반응변수들이 두 개 이상 되는 설문조사의 경우.
- ex. 환경 개선을 위해 자발적으로 (1) 더 높은 세금을 지불할 의향이 있는지, (2) 생활수준 긴축을 받아들일 의향이 있는지.
Belt-Tightening | |||
---|---|---|---|
Higher tax | Agree | Disagree | Total |
Agree | 227 | 132 | 359 |
Disagree | 107 | 678 | 785 |
Total | 334 | 810 | 1144 |
위 표에서 행의 marginal counts (359, 785)는 더 높은 세금을 지불할 의향이 있는가의 도수, 열의 marginal counts (334, 810)은 생활수준을 긴축할 의향이 있는가의 도수이다.
❗이 두 가지 질문에 "예"라고 응답할 확률은 어떻게 비교할 수 있는가?
(1) 더 높은 세금을 지불할 의향이 있는가? "예"라고 대답한 표본 비율 = 359/1144=0.314
(2) 생활수준 긴축의 의향이 있는가? "예"라고 대답한 표본 비율 = 334/1144=0.292
❓표본 오즈비는?
$$ \frac{227\times678}{132\times107}=10.9 $$
➞ 두 질문에 대한 의견에는 강한 상관성이 존재한다.
질문 1에 "예"라고 응답할 확률은
$$ P(Y_{1}=1)=\pi_{11}+\pi_{12} $$
질문 2에 "예"라고 응답할 확률은
$$ P(Y_{2}=1)=\pi_{11}+\pi_{21} $$
만약 위 두 확률이 같다면 "아니오"라고 응답할 확률도 동일하게 된다.
두 확률이 같다면 다음과 같이 표현할 수 있고,
$$ P(Y_{1}=1)=P(Y_{2}=1) $$
$$ P(Y_{1}=1)-P(Y_{2}=1)=(\pi_{11}+\pi_{12})-(\pi_{11}+\pi_{21})=\pi_{12}-\pi_{21} $$
따라서
$$ \pi_{12}=\pi_{21} $$
위 식이 성립한다면 주변동질성 Marginal Homogeneity이 존재한다고 할 수 있다.
이와 같이 대응쌍을 이루는 이항형 반응변수일 때,
주변동질성 검정법의 귀무가설은 다음과 같다.
$$ H_{0}: P(Y_{1}=1)=P(Y_{2}=1) $$
$$ H_{0}: \pi_{12}=\pi_{21} $$
댓글
댓글 쓰기