McNemar Test (맥니마 검정법)

앞선 글에 이어서 대응쌍을 이루는 이항형 반응변수에 대한 주변동질성 검정법을 더 살펴보고자 한다.

❗ 대응쌍을 이루는 이항형 반응변수일 때, 주변동질성 검정법의 귀무가설은 다음과 같다.

$$ H_{0}: P(Y_{1}=1)=P(Y_{2}=1) $$

$$ H_{0}: \pi_{12}=\pi_{21} $$

만약 귀무가설이 참이라면, n₁₂와 n₂₁가 비슷한 값을 가질 것이다.

n^* = n₁₂ + n₂₁ 가 두 칸의 도수합이라고 하면, 이렇게 두 개로 나뉘는 것은 binomial variate이기 때문이다.

귀무가설 H₀ : π₁₂ = π₂₁ 하에서 n^* 관측값이 n₁₂와 n₂₁가 될 확률은 1/2이다.

따라서 n₁₂와 n₂₁는 "성공횟수"와 "실패횟수"로, n^* 번 시행일 때 성공의 확률이 1/2인 이항분포를 따른다.

n^*이 10보다 클 때, 이 이항분포는 평균과 표준편차가 다음과 같은 정규분포와 비슷하게 된다.

$$ mean=\frac{1}{2}n^{*}, sd = \sqrt{n^{*}(\frac{1}{2})(\frac{1}{2})} $$

따라서 표준화된 정규분포의 검정통계량은 다음과 같다.

$$ z=\frac{n_{12}-(\frac{1}{2})n^{*}}{\sqrt{n^{*}(\frac{1}{2})(\frac{1}{2})}} = \frac{n_{12}-n_{21}}{\sqrt{n_{12}+n_{21}}} $$

앞선 글에서 사용했던 표를 다시 가져와서 이 검정통계량에 대입해보면

n₁₂는 132, n₂₁는 107이므로, 검정통계량 z는 다음과 같다.

$$ z= \frac{132-107}{\sqrt{132+107}}=1.62 $$

이에 대한 p-value는 0.106으로 유의수준 5% 하에서 귀무가설을 기각하지 못한다.

이를 R로 진행하면 다음과 같다.

먼저 데이터를 불러오고 위와 같은 표의 형태로 만들어준다.

위와 같은 형태의 표를 McNemar test의 input으로 넣어주고 continuity correction은 사용하지 않으므로 correct 옵션은 F로 해준다.

R에서는 z검정통계량 대신, 자유도가 1이고 근사적으로 카이제곱분포를 따르는 z²통계량을 제시한다. z²=(1.62)²=2.6151이고, 이에 대한 p-value는 0.106이다.

❗ 앞서 사용한 표를 다시 가져와 종속인 두 비율의 차이에 대한 추정에 대해 얘기하고자 한다.

증세에 "예"라고 대답할 확률은 P(Y₁=1), 긴축에 "예"라고 대답할 확률은 P(Y₂=1) 이다.

이 두 비율의 차이인 P(Y₁=1) - P(Y₂=1)에 대한 신뢰구간은 유의성검정보다 더 많은 정보를 준다.

(더 많은 정보를 준다는 것은 아직 잘 이해가 안간다.)

P(Y₁=1)=π₁₁+π₁₂이며, P(Y₂=1)=π₁₁+π₂₁이므로 이 두 비율의 차이는 π₁₂-π₂₁이다.

Bioinformatics with Park-Kleis