Which diagnostic test is better? 진단 검사 비교 기본 콘텐츠로 건너뛰기

Which diagnostic test is better? 진단 검사 비교

 의학연구에서 진단력은 매우매우 중요하다.

당장 코로나 진단키트를 구매할 때에도 실제 환자가 코로나 바이러스에 감염이 되었을 때, 키트가 정말 양성으로 진단하는 확률이 높은지를 따지게 된다. 특히 코로나 바이러스의 경우에는 전파력이 강하고, 진단키트 결과에 따라 격리여부가 결정되기 때문에 진단결과의 중요성은 매우 크다. (돈이 몇 백 억씩 왔다갔다 할 것이다.)


✅ 우리가 코로나 바이러스 진단키트를 사용할 때 따져야 할 점은 두 가지이다.

✔️ 1. 환자가 감염자일 때, 진단 검사 결과도 양성으로 나오는지?

   (≈ 환자가 감염자가 아닐 때, 진단 검사 결과도 음성으로 나오는지)

✔️ 2. 검사 결과 양성일 때, 실제로 환자가 감염자인지?

   (≈ 진단 결과가 음성일 때, 실제로 환자가 비감염자인지)


 위 두 문장을 얼핏 보면 '그게 그거 아냐?' 라는 생각을 할 수도 있지만.. 수학적으로는 엄청난 차이를 갖는다. 

 배경지식 없이 본다면 뭔가 1번 확률(환자가 감염자일 때, 검사 결과도 양성)이 높다면 2번 확률(검사 결과가 양성일 때, 실제로 환자가 감염자) 역시 높게 나올 것 같다.

 그러나.. 유병률 (prevalence of disease)이 매우 낮다면 1번 확률이 높게 나오더라도 2번 확률은 매우 낮게 나올 수 있다. 왜 그런지 천천히 살펴보도록 하자.


 앞선 포스트에서 민감도와 특이도를 설명했었는데, 유병률이 낮으면 민감도가 높더라도 양성예측도가 낮을 수 있음을 이해하기 위해서는 이를 먼저 짚고 갈 필요가 있다.

 흔히 진단 검사의 정확도를 평가할 때, 통계학에서 사용하는 용어인 민감도, 특이도, 양성예측도, 음성예측도로 위 케이스들을 정리해보자. 


민감도, 특이도, 양성예측도, 음성예측도의 정의를 다시 한 번 살펴보면,

민감도 Sensitivity : 실제 양성일 때, 양성으로 예측할 확률

특이도 Specificity : 실제 음성일 때, 음성으로 예측할 확률

양성예측도 Positive Predictive Value : 검사 결과 양성일 때, 실제 양성일 확률

음성예측도 Negative Predictive Value : 검사 결과 음성일 때, 실제 음성일 확률


위 정의를 통해 아래 케이스를 적용해보면,

✔️ 1. 환자가 감염자일 때, 진단 검사 결과도 양성으로 나오는지? ⇨ 민감도

 ✔️ 1-1. 환자가 감염자가 아닐 때, 진단 검사 결과도 음성으로 나오는지 ⇨ 특이도

✔️ 2. 진단 검사 결과 양성일 때, 실제로 환자가 감염자인지? ⇨ 양성예측도

 ✔️ 2-1. 진단 검사 결과 음성일 때, 실제로 환자가 비감염자인지 ⇨ 음성예측도


📖 진단 검사의 정확도를 나타내는 위 네 가지를 아래 표를 통해서 살펴보자.

Diseased Non-Diseased
Test A Test A
Pos + Neg - Pos + Neg -
Test B Pos + a c e g
Neg - b d f h


Test A와 Test B의 정확예측도를 구하는 방법은 같으므로 여기에서는 Test A에 해당하는 정확예측도만을 구해보도록 한다.

민감도란 '실제 감염자'이라는 조건이 먼저 주어져야 하므로, 위 표에서 왼 쪽에 위치한 Diseased 표만 보면 된다. 조건은 '실제 감염자'이므로 분모가 실제 감염자인 (a+b+c+d)가 될 것이다. 그 중에서도 진단검사 결과 양성인 사람들은 (a+b)이므로, Test A의 민감도는 다음과 같다.

Sensitivity of Test A : (a+b) / (a+b+c+d)


특이도를 구하는 방식은 민감도를 구하는 방법과 비슷하다. 감염 ⇨ 비감염, 양성 ⇨ 음성으로만 바꿔주면 된다. 여기에서 조건은 '실제 비감염자'이므로 오른쪽에 위치한 Non-Diseased 표만 보면 되고, 따라서 분모는 (e+f+g+h)이다. 이 중에서도 진단 검사 결과 음성인 사람들은 (g+h)이므로, Test A의 특이도는 다음과 같다.

Specificity of Test A : (g+h) / (e+f+g+h)


양성예측도조건(=분모)은 '진단 검사 결과가 양성'이므로 (a+b+e+f)가 된다. 양성예측도는 이 조건 중에서도 '실제로 감염자'인 사람들이므로 분자는 (a+b)이다. 따라서 Test A의 양성예측도는 다음과 같다.

Positive Predictive Value of Test A : (a+b) / (a+b+e+f)


음성예측도조건은 '진단 검사 결과가 음성'이므로 분모는 (c+d+g+f)이다. 음성예측도는 이 조건 중에서도 '실제로 비감염'이므로 분자는 (g+f)가 된다. 따라서 Test A의 음성예측도는 다음과 같다.

Negative Predictive Value of Test A : (g+f) / (c+d+g+f)



❗📓 위 개념을 파악했다면 앞서 언급한 민감도와 양성예측도의 관계에 대해 다시 살펴보도록 하자.

대충 생각하면 민감도가 높으면 양성예측도도 높을 것 같은데, 이미 언급했듯이 유병률(prevalence of disease)에 따라 민감도가 높아도 양성예측도는 낮게 나올 수 있다고 하였다. 이것을 그냥 개념적으로만 접근하면 잘 이해가 안되니 예시를 통해 살펴보도록 하겠다.


📌독감을 진단하는 두 개의 테스트 A, B 키트를 통해 독감 진단 검사를 실시하였고 그 결과는 다음 표와 같다.

Diseased Non-Diseased
Test A Test A
Pos + Neg - Pos + Neg -
Test B Pos + 5 1 15 25
Neg - 3 1 30 170


A 키트와 B 키트 중 어떤 진단 키트가 더 나은지 통계적으로 결론을 내리기 전에 Test A의 민감도와 양성예측도 보고를 위해 이 두 값들을 먼저 구하고자 한다.

Test A의 민감도는 위 정의에 따라 (5+3) / (5+3+1+1) = 80% 이다. 이는 실제 감염자가 100명일 때, 이 감염자들에 A키트를 적용하면 이 중 80명에 대해서는 양성이라는 결과를 얻는다는 것을 의미한다.

한편 A 키트의 양성예측도는 (5+3) / (5+3+15+30) = 15% 이다. 이는 진단 검사 결과 양성인 사람이 100명 있다면, 이 중 실제 감염자는 15명이라는 의미이다. 

민감도 80% 와 양성예측도 15% 는 엄청난 차이를 갖는다. 왜 이런 차이가 나는 것일까? 이는 앞서 말한 유병률 때문인데, 

🔍 위 케이스에서 유병률은 (5+3+1+1) / (5+3+1+1+15+25+30+150) = 4% 이다. 이는 100명 중 4명에게서 해당 질병이 발생하는 확률로 결코 높다고 할 수 없다. 따라서 4%의 유병률을 보인다면, Diseased 군 보다는 Non-Diseased군에 더 많은 인원이 분포할 것이다.

민감도Diseased 군 내에서만 살펴보기 때문에 유병률을 살필 필요 없이 Diseased 군 내에서의 양성결과만 살펴보면 되지만, 양성예측도는 Diseased군의 양성률과 더불어 Non-Diseased 군에서의 양성률도 살펴야하고, 유병률이 낮다면 Non-Diseased 군이 더 많은 숫자를 가질 것이므로 양성예측도가 낮게 나올 수 밖에 없는 것이다.



 📒원래는 두 진단 검사 A와 B 중 어떤 검사가 나은지 통계적으로 검정하는 방법을 설명하려 했는데 이를 위해서 위 개념들이 필요했기에 설명이 매우 길어졌다. 😅

 위 개념들을 천천히 익혀야 통계적 검정 방법을 이해할 수 있으므로 이번에는 여기서 줄이고, 다음 번에 두 진단 검사를 통계적으로 비교하는 방법을 설명하도록 하겠다.

댓글

이 블로그의 인기 게시물

통계 기초 : 확률 분포 - (1) 이항분포

Binomial distribution 이항분포에 앞서 베르누이분포가 있다. 모든 가능한 결과가 두 가지인 실험(표본공간이 {불량품, 양호품},{찬성, 반대} 등)을 베르누이 시행(Bernoulli trial)이라 한다. 성공확률을 p 라고 할 때, '성공'이면 1, '실패'면 0으로 대응시키는 확률변수를 베르누이 확률변수라 한다. 베르누이 확률변수 X의 확률분포는 다음과 같이 정의할 수 있다. $$ P(X=x) = p^{x}(1-p)^{1-x}, x=0,1 $$ 따라서, X=0인 경우에는 P(X=0) = (1-p)이고, X=1인 경우에는 P(X=1) = p가 된다. 베르누이분포의 평균은 E(X)=p, Var(X)=p(1-p) 이다. 이처럼 동일한 성공확률을 가진 베르누이 시행 을 독립적 으로 반복 하여 시행할 때, 'X=성공횟수'의 분포를 이항분포(binomial distribution)이라 한다. 성공확률이 p인 베르누이 시행을 n번 독립적으로 반복 시행할 때, '성공횟수(=X)'가 x일 확률은 다음과 같이 표시할 수 있다. $$ P(X=x) = (\frac{n}{x})p^{x}(1-p)^{n-x}, x=0,1,2, ..., n $$ 이항분포의 평균은 E(X)=np, 분산은 Var(X)=np(1-p) 이다. 증명은  https://proofwiki.org/wiki/Variance_of_Binomial_Distribution  참고하면 된다. 여기에서 n , p 를 이항분포의 모수(parameter)라 한다. 만약 n=1이라면, 이항분포 B ( n , p )는 '1(성공)'의 확률이 p 인 베르누이분포이다. 참고로 모수는 모집단의 특성값으로, 평균, 분산, 성공확률 등을 예시로 들 수 있다.

Odds Ratio and Relative Risk ; 오즈비와 상대위험도

  Odds Ratio 는 임상에서 매우 많이 사용되는 개념이다. 그러나 'Odds' 라는 개념이 직관적으로 잘 와닿지 않기 때문에 흔히 오용되기도 하는 개념이라 가장 먼저 잡고가야 할 주제로 삼았다.   오즈비는 범주형 자료에서 사용되는데, 오즈비를 보면서 가장 많이 접하게 될  2X2 분할표는 다음과 같이 생겼다.   Event Normal Total Exposed A B A + B Non-exposed C D C + D 흔히 하는 실수가 오즈비(Odds Ratio)를 해석할 때, 상대위험도(Relative risk)를 해석하듯이 한다는 점이다. 따라서 오즈비와 상대위험도의 각 개념에 대해서 살펴보고 넘어가도록 하자.   ❗Odds Ratio와 Relative Risk의 공통점 : 상대적인 비율 을 나타낸다. Public health / Medical 에서 Odds Ratio or Relative Risk를 사용하는 이유 - 어떤 조건에서 더 위험한지를 수치적으로 나타내기 위해서 사용 한다. 예를 들면, "흡연(조건)"을 하는 사람은 비흡연자에 비해 "폐암(Event)" 발생에 있어서 몇 배가 더 위험한가? 와 같은 질문에 대한 해답으로 많이 사용된다.   ✅위와 같은 2X2 이차원 분할표에서 Odds Ratio (오즈비) 의 수식적 정의 는 다음과 같다. P1 = A/(A+B) ; P2 = C/(C+D) Odds1 = P1/(1-P1) ; Odds2 = P2/(1-P2) Odds Ratio = Odds1/Odds2 = A*D/B*C ✅ 한편 2X2 분할표에서 Relative Risk (상대위험도) 의 수식적 정의 는 ...

Odds Ratio and Relative Risk ; 오즈비와 상대위험도 part. 2

 지난 글에서 2X2 분할표에서 많이 사용되는 오즈비와 상대위험도의 개념에 대해서 살펴보았다. 그 중에서도 지난 글에서는 오즈비를 사용할 수밖에 없는 경우에 대해 살펴보았다.  상대위험도가 직관적으로 이해하기 쉽고 위험비에 대한 쉬운 해석을 가능하게 하지만, 그럼에도 불구하고 보건 or 의학 계열에서 오즈비를 많이 사용 할 수밖에 없는 이유에 대해 살펴보았다. 또한 오즈비와 상대위험도는 가끔 동일하게 해석되기도 한다. (자세한 내용은 이전 글로..) 그럼 이번 글에서는 오즈비와 상대위험도를 동일하게 해석할 수 있는 경우 에 대해 살펴보도록 하겠다. 먼저 다음과 같은 오즈비의 특성을 이해해야 한다. 오즈비의 중요 특성: 상대적인 위험도를 과장하는 측면 이 있다. 이는 굉장히 중요한 오즈비의 특성인데, Relative Risk 값보다 항상 큰 값을 가진다. 그리고 이는 해당 Event가 흔하게 일어날 수록 더욱 더 과장 된다. 📋예를 들어 보자. 따듯한 차를 마셨을 때와 방안 온도의 차를 마셨을 때 체온이 상승하는지 아니면 그대로 유지되는지에 대해 조사하고 다음과 같은 분할표를 얻었다.   체온 상승 유지 Total Warm tea 90 10 100 Normal temp 20 180 200 먼저 Relative Risk 상대위험도 를 구해보자. $$ \frac{90/100}{20/200} = 9 $$ 이번엔 Odds Ratio 오즈비 를 구해보자. (유도과정은 이전 글 참고) $$ \frac{90 * 180}{20 * 10} = 81 $$ 이번엔 방금 구한 상대위험도와 오즈비를 해석해보자. 📉 RR : 상대위험도는 9로, 이는 따듯한 차를 마신다면 체온이 상승할 확률이 방안 온도의 차를 마셨을 때보다 체온이 상승할 확률...