McNemar Test (맥니마 검정법) - (1) 이항형 대응쌍에 대한 종속비율들의 비교

두 표본이 있다.

한 표본의 개체와 다른 표본의 개체가 짝지어진 경우의 범주형 반응변수를 비교하고 싶을 때,

두 표본의 반응변수들을 대응쌍(matched pairs)이라 한다.

대응쌍의 예시로는

1) longitudinal 연구에서 동일한 대상을 시간의 흐름에 따라 반복적으로 관측하는 경우.

- ex. 식습관을 바꾸기 전의 체중과 바꾼 후의 체중

2) 같은 범주를 갖는 유사한 반응변수들이 두 개 이상 되는 설문조사의 경우.

- ex. 환경 개선을 위해 자발적으로 (1) 더 높은 세금을 지불할 의향이 있는지, (2) 생활수준 긴축을 받아들일 의향이 있는지.

위 표에서 행의 marginal counts (359, 785)는 더 높은 세금을 지불할 의향이 있는가의 도수, 열의 marginal counts (334, 810)은 생활수준을 긴축할 의향이 있는가의 도수이다.

❗이 두 가지 질문에 "예"라고 응답할 확률은 어떻게 비교할 수 있는가?

(1) 더 높은 세금을 지불할 의향이 있는가? "예"라고 대답한 표본 비율 = 359/1144=0.314

(2) 생활수준 긴축의 의향이 있는가? "예"라고 대답한 표본 비율 = 334/1144=0.292

❓표본 오즈비는?

$$ \frac{227\times678}{132\times107}=10.9 $$

➞ 두 질문에 대한 의견에는 강한 상관성이 존재한다.

질문 1에 "예"라고 응답할 확률은

$$ P(Y_{1}=1)=\pi_{11}+\pi_{12} $$

질문 2에 "예"라고 응답할 확률은

$$ P(Y_{2}=1)=\pi_{11}+\pi_{21} $$

만약 위 두 확률이 같다면 "아니오"라고 응답할 확률도 동일하게 된다.

두 확률이 같다면 다음과 같이 표현할 수 있고,

$$ P(Y_{1}=1)=P(Y_{2}=1) $$

$$ P(Y_{1}=1)-P(Y_{2}=1)=(\pi_{11}+\pi_{12})-(\pi_{11}+\pi_{21})=\pi_{12}-\pi_{21} $$

따라서

$$ \pi_{12}=\pi_{21} $$

위 식이 성립한다면 주변동질성 Marginal Homogeneity이 존재한다고 할 수 있다.

이와 같이 대응쌍을 이루는 이항형 반응변수일 때,

주변동질성 검정법의 귀무가설은 다음과 같다.

$$ H_{0}: P(Y_{1}=1)=P(Y_{2}=1) $$

$$ H_{0}: \pi_{12}=\pi_{21} $$

Bioinformatics with Park-Kleis