통계 기초 : the meaning of power (통계 파워의 의미) + 알파 + 베타

통계를 처음 공부할 때, 마주하는 아주 중요한 개념들이 있다.

특히 통계적인 검정을 하고자 할 때, 기초적 검정이든 고급 검정이든 이번에 정리하고자 하는 개념들은 항상 사용되기 때문에 확실하게 알고 가는 것이 좋다. ~~(항상 헷갈림)~~

📙 1. 통계학개론과 같은 교재에서 '검정(hypothesis test)' 파트에 도달하면 가장 먼저 나오는 단어(?) 중에 하나가 '알파α'이다.

통계에서 알파α는 유의 수준(significance level)이라는 개념을 갖고 있다.

유의 수준은 제 1종의 오류(=귀무가설이 사실인데 기각하는 오류)를 허용할 확률이다. 유의 수준으로는 5%가 많이 사용되는데, 이는 제 1종의 오류를 허용할 확률이 5%라는 의미이다. 따라서 통계 검정시 유의 확률(p-value)이 유의 수준(significance level)인 5%보다 작으면 귀무가설을 기각하게 되는 것이다.

알파를 간단하게 정리하면 다음과 같이 나타낼 수 있다.

📌 알파 = 유의 수준 = 제 1종의 오류 = 위양성

α (alpha) = significance level = type 1 error = false positive

📘 2. 검정(hypothesis test) 파트에서 알파 다음으로 나오는 개념이 '베타β'이다.

알파α가 제 1종의 오류를 나타냈다면, 베타β는 제 2종의 오류(=귀무가설이 거짓인데도 기각하지 않는 오류)를 나타낸다. 제 2종의 오류는 제 1종의 오류보다는 상대적으로 덜 치명적이긴 하지만, 여전히 오류라는 사실을 벗어날 수 없다.

베타를 간단하게 정리하면 다음과 같이 나타낼 수 있다.

📌 베타 = 제 2종의 오류 = 위음성

β (beta) = type 2 error = false negative

이를 그림으로 나타나면 다음과 같다. (출처는 scribbr)

📋통계에서 검정력(=Power)이라 불리는 개념은 1에서 베타를 뺀 것이다.

즉, '검정력=Power'는 1에서 제 2종의 오류 확률을 뺀 것으로, 귀무가설이 거짓일 때 귀무가설을 기각할 확률이며, 이는 대립가설이 참일 때 대립가설을 받아들일 확률로, True Positive일 확률이다.

검정력을 간단하게 정리하면 다음과 같다.

📌 Power in statistics

= 1 - β (beta)

= 1 - type 2 error

= 1 - Pr(False Negative)

= True Positive

= probability of accepting an alternative hypothesis when the alternative hypothesis is true.

=Pr(reject H0 | H1 is true)

= Sensitivity

따라서 높은 통계적 검정력이란 의미는 제 2종의 오류의 risk가 작다는 것을 의미한다.

"High statistical power" means there is small risk of having type 2 errors(false negative).

이론적으로는 제 2종의 오류와 제 1종의 오류를 모두 줄이는 것이 좋지만 불가능하다. 알파를 작게하면 베타가 커지고, 베타를 줄이면 알파가 커진다.

예를 들어, Bonferroni correction을 하게 되면 제 1종의 오류를 줄이게 되는, 매우 보수적인 방법이다. 따라서 Bonferroni correction을 적용하면 제 2종의 오류 확률이 증가하게 된다.

반대도 마찬가지이다. 제 2종의 오류를 줄이려 한다면 귀무가설을 기각할 확률이 증가하므로 제 1종의 오류가 증가하게 된다.

아래 표를 가지고도 생각해볼 수 있다.

		Predicted
		Positive	Negative
Actual	Positive	True Positive (TP)	False Negative (FN) = beta
Actual	Negative	False Positive (FP) = alpha	True Negative (TN)

Bioinformatics with Park-Kleis

이 블로그 검색

통계 기초 : the meaning of power (통계 파워의 의미) + 알파 + 베타

태그

댓글

댓글 쓰기

이 블로그의 인기 게시물

통계 : Dummy Variable Trap

통계 기초 : 확률 분포 - (1) 이항분포

Odds Ratio and Relative Risk ; 오즈비와 상대위험도