의학연구에서 진단력은 매우매우 중요하다.
당장 코로나 진단키트를 구매할 때에도 실제 환자가 코로나 바이러스에 감염이 되었을 때, 키트가 정말 양성으로 진단하는 확률이 높은지를 따지게 된다. 특히 코로나 바이러스의 경우에는 전파력이 강하고, 진단키트 결과에 따라 격리여부가 결정되기 때문에 진단결과의 중요성은 매우 크다. (돈이 몇 백 억씩 왔다갔다 할 것이다.)
✅ 우리가 코로나 바이러스 진단키트를 사용할 때 따져야 할 점은 두 가지이다.
✔️ 1. 환자가 감염자일 때, 진단 검사 결과도 양성으로 나오는지?
(≈ 환자가 감염자가 아닐 때, 진단 검사 결과도 음성으로 나오는지)
✔️ 2. 검사 결과 양성일 때, 실제로 환자가 감염자인지?
(≈ 진단 결과가 음성일 때, 실제로 환자가 비감염자인지)
위 두 문장을 얼핏 보면 '그게 그거 아냐?' 라는 생각을 할 수도 있지만.. 수학적으로는 엄청난 차이를 갖는다.
배경지식 없이 본다면 뭔가 1번 확률(환자가 감염자일 때, 검사 결과도 양성)이 높다면 2번 확률(검사 결과가 양성일 때, 실제로 환자가 감염자) 역시 높게 나올 것 같다.
그러나.. 유병률 (prevalence of disease)이 매우 낮다면 1번 확률이 높게 나오더라도 2번 확률은 매우 낮게 나올 수 있다. 왜 그런지 천천히 살펴보도록 하자.
앞선 포스트에서 민감도와 특이도를 설명했었는데, 유병률이 낮으면 민감도가 높더라도 양성예측도가 낮을 수 있음을 이해하기 위해서는 이를 먼저 짚고 갈 필요가 있다.
흔히 진단 검사의 정확도를 평가할 때, 통계학에서 사용하는 용어인 민감도, 특이도, 양성예측도, 음성예측도로 위 케이스들을 정리해보자.
❗민감도, 특이도, 양성예측도, 음성예측도의 정의를 다시 한 번 살펴보면,
❔민감도 Sensitivity : 실제 양성일 때, 양성으로 예측할 확률
❔특이도 Specificity : 실제 음성일 때, 음성으로 예측할 확률
❔양성예측도 Positive Predictive Value : 검사 결과 양성일 때, 실제 양성일 확률
❔음성예측도 Negative Predictive Value : 검사 결과 음성일 때, 실제 음성일 확률
위 정의를 통해 아래 케이스를 적용해보면,
✔️ 1. 환자가 감염자일 때, 진단 검사 결과도 양성으로 나오는지? ⇨ 민감도
✔️ 1-1. 환자가 감염자가 아닐 때, 진단 검사 결과도 음성으로 나오는지 ⇨ 특이도
✔️ 2. 진단 검사 결과 양성일 때, 실제로 환자가 감염자인지? ⇨ 양성예측도
✔️ 2-1. 진단 검사 결과 음성일 때, 실제로 환자가 비감염자인지 ⇨ 음성예측도
📖 진단 검사의 정확도를 나타내는 위 네 가지를 아래 표를 통해서 살펴보자.
Diseased | Non-Diseased | ||||
---|---|---|---|---|---|
Test A | Test A | ||||
Pos + | Neg - | Pos + | Neg - | ||
Test B | Pos + | a | c | e | g |
Neg - | b | d | f | h |
Test A와 Test B의 정확예측도를 구하는 방법은 같으므로 여기에서는 Test A에 해당하는 정확예측도만을 구해보도록 한다.
①민감도란 '실제 감염자'이라는 조건이 먼저 주어져야 하므로, 위 표에서 왼 쪽에 위치한 Diseased 표만 보면 된다. 조건은 '실제 감염자'이므로 분모가 실제 감염자인 (a+b+c+d)가 될 것이다. 그 중에서도 진단검사 결과 양성인 사람들은 (a+b)이므로, Test A의 민감도는 다음과 같다.
Sensitivity of Test A : (a+b) / (a+b+c+d)
②특이도를 구하는 방식은 민감도를 구하는 방법과 비슷하다. 감염 ⇨ 비감염, 양성 ⇨ 음성으로만 바꿔주면 된다. 여기에서 조건은 '실제 비감염자'이므로 오른쪽에 위치한 Non-Diseased 표만 보면 되고, 따라서 분모는 (e+f+g+h)이다. 이 중에서도 진단 검사 결과 음성인 사람들은 (g+h)이므로, Test A의 특이도는 다음과 같다.
Specificity of Test A : (g+h) / (e+f+g+h)
③양성예측도의 조건(=분모)은 '진단 검사 결과가 양성'이므로 (a+b+e+f)가 된다. 양성예측도는 이 조건 중에서도 '실제로 감염자'인 사람들이므로 분자는 (a+b)이다. 따라서 Test A의 양성예측도는 다음과 같다.
Positive Predictive Value of Test A : (a+b) / (a+b+e+f)
④음성예측도의 조건은 '진단 검사 결과가 음성'이므로 분모는 (c+d+g+f)이다. 음성예측도는 이 조건 중에서도 '실제로 비감염'이므로 분자는 (g+f)가 된다. 따라서 Test A의 음성예측도는 다음과 같다.
Negative Predictive Value of Test A : (g+f) / (c+d+g+f)
❗📓 위 개념을 파악했다면 앞서 언급한 민감도와 양성예측도의 관계에 대해 다시 살펴보도록 하자.
대충 생각하면 민감도가 높으면 양성예측도도 높을 것 같은데, 이미 언급했듯이 유병률(prevalence of disease)에 따라 민감도가 높아도 양성예측도는 낮게 나올 수 있다고 하였다. 이것을 그냥 개념적으로만 접근하면 잘 이해가 안되니 예시를 통해 살펴보도록 하겠다.
📌독감을 진단하는 두 개의 테스트 A, B 키트를 통해 독감 진단 검사를 실시하였고 그 결과는 다음 표와 같다.
Diseased | Non-Diseased | ||||
---|---|---|---|---|---|
Test A | Test A | ||||
Pos + | Neg - | Pos + | Neg - | ||
Test B | Pos + | 5 | 1 | 15 | 25 |
Neg - | 3 | 1 | 30 | 170 |
A 키트와 B 키트 중 어떤 진단 키트가 더 나은지 통계적으로 결론을 내리기 전에 Test A의 민감도와 양성예측도 보고를 위해 이 두 값들을 먼저 구하고자 한다.
Test A의 민감도는 위 정의에 따라 (5+3) / (5+3+1+1) = 80% 이다. 이는 실제 감염자가 100명일 때, 이 감염자들에 A키트를 적용하면 이 중 80명에 대해서는 양성이라는 결과를 얻는다는 것을 의미한다.
한편 A 키트의 양성예측도는 (5+3) / (5+3+15+30) = 15% 이다. 이는 진단 검사 결과 양성인 사람이 100명 있다면, 이 중 실제 감염자는 15명이라는 의미이다.
민감도 80% 와 양성예측도 15% 는 엄청난 차이를 갖는다. 왜 이런 차이가 나는 것일까? 이는 앞서 말한 유병률 때문인데,
🔍 위 케이스에서 유병률은 (5+3+1+1) / (5+3+1+1+15+25+30+150) = 4% 이다. 이는 100명 중 4명에게서 해당 질병이 발생하는 확률로 결코 높다고 할 수 없다. 따라서 4%의 유병률을 보인다면, Diseased 군 보다는 Non-Diseased군에 더 많은 인원이 분포할 것이다.
민감도는 Diseased 군 내에서만 살펴보기 때문에 유병률을 살필 필요 없이 Diseased 군 내에서의 양성결과만 살펴보면 되지만, 양성예측도는 Diseased군의 양성률과 더불어 Non-Diseased 군에서의 양성률도 살펴야하고, 유병률이 낮다면 Non-Diseased 군이 더 많은 숫자를 가질 것이므로 양성예측도가 낮게 나올 수 밖에 없는 것이다.
📒원래는 두 진단 검사 A와 B 중 어떤 검사가 나은지 통계적으로 검정하는 방법을 설명하려 했는데 이를 위해서 위 개념들이 필요했기에 설명이 매우 길어졌다. 😅
위 개념들을 천천히 익혀야 통계적 검정 방법을 이해할 수 있으므로 이번에는 여기서 줄이고, 다음 번에 두 진단 검사를 통계적으로 비교하는 방법을 설명하도록 하겠다.
댓글
댓글 쓰기