Odds Ratio and Relative Risk ; 오즈비와 상대위험도 기본 콘텐츠로 건너뛰기

Odds Ratio and Relative Risk ; 오즈비와 상대위험도

 Odds Ratio는 임상에서 매우 많이 사용되는 개념이다. 그러나 'Odds' 라는 개념이 직관적으로 잘 와닿지 않기 때문에 흔히 오용되기도 하는 개념이라 가장 먼저 잡고가야 할 주제로 삼았다.

 

오즈비는 범주형 자료에서 사용되는데, 오즈비를 보면서 가장 많이 접하게 될  2X2 분할표는 다음과 같이 생겼다.

 

Event

Normal

Total

Exposed

A

B

A + B

Non-exposed

C

D

C + D






흔히 하는 실수가 오즈비(Odds Ratio)를 해석할 때, 상대위험도(Relative risk)를 해석하듯이 한다는 점이다. 따라서 오즈비와 상대위험도의 각 개념에 대해서 살펴보고 넘어가도록 하자.

 

❗Odds Ratio와 Relative Risk의 공통점 : 상대적인 비율을 나타낸다.

Public health / Medical 에서 Odds Ratio or Relative Risk를 사용하는 이유 - 어떤 조건에서 더 위험한지를 수치적으로 나타내기 위해서 사용한다.

예를 들면, "흡연(조건)"을 하는 사람은 비흡연자에 비해 "폐암(Event)" 발생에 있어서 몇 배가 더 위험한가? 와 같은 질문에 대한 해답으로 많이 사용된다.

 

✅위와 같은 2X2 이차원 분할표에서 Odds Ratio (오즈비)의 수식적 정의는 다음과 같다.

P1 = A/(A+B) ; P2 = C/(C+D)

Odds1 = P1/(1-P1) ; Odds2 = P2/(1-P2)

Odds Ratio = Odds1/Odds2 = A*D/B*C


한편 2X2 분할표에서 Relative Risk (상대위험도)의 수식적 정의는 다음과 같다.

RR = P1 / P2


 

📋이렇게만 보면 직관적으로 감이 잘 오지 않으니 예시를 들어 살펴보겠다.

 흡연군과 비흡연군에서 폐암 발생 환자와 정상인은 다음과 같이 조사되었다. (내가 마음대로 만든 숫자ㅋ)

 

폐암

정상

Total

흡연

25

125

150

비흡연

40

360

400


📉위와 같은 분할표에서 Relative Risk를 먼저 구하면

$$ \frac{25/150}{40/400} = 1.67 $$

RR 상대위험도가 1.67이라는 의미는 흡연을 하는 그룹이 비흡연 그룹에 비해 1.67배 더 높다라고 해석할 수 있다.


📈이번에는 Odds Ratio(OR) 오즈비를 구해보도록 하겠다.

흡연 그룹의 Odds  $$ \frac{25/150}{125/150} = 0.2 $$

비흡연 그룹의 Odds  $$ \frac{40/400}{360/400} = 0.111 $$

Odds Ratio 오즈비 = 흡연 그룹의 Odds / 비흡연 그룹의 Odds = 0.2/0.111 = 1.8

⇨ OR 오즈비는 흡연 그룹의 오즈가 비흡연 그룹의 오즈보다 1.8배 더 높다라고 해석할 수 있다.



상대위험도에 비해 오즈비는 직관적인 해석이 조금 더 어렵다.

흡연그룹이 비흡연그룹에 비해 폐암에 대한 위험도가 1.67배가 더 높다는 것은 너무 잘 와닿는데 흡연그룹의 "Odds오즈"가 비흡연그룹의 "Odds오즈"에 비해 1.8배가 더 높다는 것은 무슨 의미인가?


Odds 오즈의 정의"성공확률/실패확률"이라 할 수 있고, 흡연 그룹의 Odds가 0.2 라는 의미는 흡연 그룹에서 정상인 사람이 10명 나올 때마다 폐암에 걸린 사람이 2명씩 나온다는 의미이다.

마찬가지로 비흡연 그룹의 Odds가 0.11 이라는 의미는 비흡연 그룹에서 정상인 사람이 10명 나올 때마다 폐암에 걸린 사람이 1.1명씩 나온다는 의미이다.


이 둘을 나눈 "흡연그룹의 Odds"/"비흡연그룹의 Odds" 가 바로 Odds Ratio 오즈비인데, 오즈비가 1.8이라는 의미는 <흡연그룹의 Odds가 비흡연그룹의 Odds보다 1.8배가 높다.>는 의미이다. 

즉, 흡연 그룹에서 정상인 사람이 10명 나올 때마다 폐암에 걸린 사람이 나올 비율이 비흡연 그룹에서 정상인 사람이 10명 나올 때마다 폐암에 걸릴 사람이 나올 비율보다 1.8배가 높다는 의미로 해석할 수 있다. 


결론은 상대위험도와 오즈비 모두 흡연 그룹이 비흡연 그룹보다 폐암에 더 취약하다는 것을 이야기 해주고 있다는 것이다.


❓그럼 위 오즈비를 "흡연 그룹이 비흡연 그룹보다 폐암에 걸릴 확률이 1.8배가 더 높다"고 해석할 수 있을까?


Odds Ratio 혹은 Relative Risk 결과를 해석할 때 다음과 같은 문장을 많이 보게 된다.

"위험인자에 노출된 경우에는 노출되지 않은 경우에 비해  암 발생 확률이 대략 3배 더 높다."


이렇게 해석해도 되는걸까?


결론은 오즈비와 상대위험도는 종종 같은 의미로 해석하는 경우들이 많은데, 엄밀히 파자면 해석도 달리해야 하고 실험 설계에 따라 달리 사용해야 한다. 그러나 때에 따라서 오즈비와 상대위험도를 동일하게 해석할 수도 있다.


두 수치 모두 상대적인 위험도를 나타낸다는 것은 알겠는데 그럼 무슨 차이가 있지? 상대위험도가 이해하기 훨씬 쉽고 많이 사용되는데 오즈비는 도대체 왜 사용하는거지? 때에 따라 동일하게 해석도 가능하다는데 오즈비를 왜 써야하지? 라는 의문이 든다.


먼저 이번에는 반드시 오즈비를 사용해야 하는 경우를 설명하고, 다음 글에서 오즈비와 상대위험도를 동일하게 해석할 수 있는 경우에 대해 소개하고자 한다.


먼저 오즈비(Odds Ratio)는 직관적인 해석은 어렵지만, 그럼에도 불구하고 특히 보건/의료 분야에서 굉장히 많이 사용된다.

그 이유는 보건 / 의료 분야에서 현실적으로 코호트 연구를 하기에는 상당한 시간과 비용이 들어가 사례-대조 연구 (case-control study)를 사용하는 경우가 많다. 이처럼 사례-대조 연구를 할 때에는 Relative Risk를 사용할 수 없다.


❓도대체 왜? 후향적 연구인 사례-대조 연구에서는 상대위험도를 사용할 수 없는가?

이게 굉장히 중요한 질문인데, 이는 분할표로 다시 돌아와야 한다.


 

폐암

정상

Total

흡연

25

125

150

비흡연

40

360

400



사례-대조 연구로 위 분할표를 얻었다고 생각해보자.

그때는 상대위험도를 구하려면 흡연그룹에서 폐암에 걸린 사람과, 비흡연그룹에서 폐암에 걸린 사람의 비율을 구해야 한다. 

흡연그룹에서 폐암에 걸린 사람의 비율은 25/150이다.
문제는 여기에 있다. 이것은 조건부 확률로 흡연그룹의 population 에 대한 정보를 알 때에만 사용할 수 있다.

사례-대조 연구에서 알 수 있는 population 정보는 폐암에 걸린 그룹과 정상 그룹에 대한 정보이다. 애초에 폐암그룹과 정상그룹에서 위험요인에 노출 된 사람들을 조사하는 실험 설계이기 때문이다.

이 경우에는 분할표는 위가 아닌 아래처럼 작성해야 한다.

 

폐암

정상

흡연

25

125

비흡연

40

360

Total

65

485


사례-대조 연구로 위 분할표를 얻었을 때, 알 수 있는 정보는 폐암 그룹과 정상 그룹이다.

이 경우, 알 수 있는 것은 폐암에 걸린 사람 중 흡연에 노출되었던 사람의 비율, 정상인 그룹에서 흡연에 노출되었던 사람의 비율이다.


 

Event

Normal

Exposed

A

B

Non-exposed

C

D

Total

A + C

B + D





따라서 Event 그룹의 Odds는 $$ \frac{A/A+C}{C/A+C} = {A/C} $$

Normal 그룹의 Odds는 $$ \frac{B/B+D}{D/B+D} = {B/D} $$

따라서 두 그룹의 오즈비 Odds Ratio는 $$ \frac{A/C}{B/D} = {A*D/B*C} $$


이는 Exposed 그룹과 Non-Exposed 그룹에서 구했던 오즈비와 정확히 일치한다.

흡연과 폐암의 분할표로 돌아가서..

 

폐암

정상

흡연

25

125

비흡연

40

360

Total

65

485



폐암 그룹의 Odds는 $$ \frac{25/65}{40/65} = {25/40} = 0.625 $$
정상 그룹의 Odds는 $$ \frac{125/485}{360/485} = {125/360} = 0.3472 $$
따라서 두 그룹의 Odds Ratio 오즈비는 0.625/0.3472 = 1.8

위에서 구했던 흡연그룹과 비흡연 그룹의 오즈비와 정확히 일치한다.

따라서 사례-대조 연구를 사용할 때에는 상대위험도(Relative Risk)를 사용할 수 없고, 오즈비(Odds Ratio)를 사용하여야 한다.


다음 글에서는 상대적으로 훨씬 쉽게 이해할 수 있는.. 상대위험도와 오즈비를 동일하게 해석할 수 있는 경우를 소개한다.


댓글

이 블로그의 인기 게시물

통계 기초 : 확률 분포 - (1) 이항분포

Binomial distribution 이항분포에 앞서 베르누이분포가 있다. 모든 가능한 결과가 두 가지인 실험(표본공간이 {불량품, 양호품},{찬성, 반대} 등)을 베르누이 시행(Bernoulli trial)이라 한다. 성공확률을 p 라고 할 때, '성공'이면 1, '실패'면 0으로 대응시키는 확률변수를 베르누이 확률변수라 한다. 베르누이 확률변수 X의 확률분포는 다음과 같이 정의할 수 있다. $$ P(X=x) = p^{x}(1-p)^{1-x}, x=0,1 $$ 따라서, X=0인 경우에는 P(X=0) = (1-p)이고, X=1인 경우에는 P(X=1) = p가 된다. 베르누이분포의 평균은 E(X)=p, Var(X)=p(1-p) 이다. 이처럼 동일한 성공확률을 가진 베르누이 시행 을 독립적 으로 반복 하여 시행할 때, 'X=성공횟수'의 분포를 이항분포(binomial distribution)이라 한다. 성공확률이 p인 베르누이 시행을 n번 독립적으로 반복 시행할 때, '성공횟수(=X)'가 x일 확률은 다음과 같이 표시할 수 있다. $$ P(X=x) = (\frac{n}{x})p^{x}(1-p)^{n-x}, x=0,1,2, ..., n $$ 이항분포의 평균은 E(X)=np, 분산은 Var(X)=np(1-p) 이다. 증명은  https://proofwiki.org/wiki/Variance_of_Binomial_Distribution  참고하면 된다. 여기에서 n , p 를 이항분포의 모수(parameter)라 한다. 만약 n=1이라면, 이항분포 B ( n , p )는 '1(성공)'의 확률이 p 인 베르누이분포이다. 참고로 모수는 모집단의 특성값으로, 평균, 분산, 성공확률 등을 예시로 들 수 있다.

Odds Ratio and Relative Risk ; 오즈비와 상대위험도 part. 2

 지난 글에서 2X2 분할표에서 많이 사용되는 오즈비와 상대위험도의 개념에 대해서 살펴보았다. 그 중에서도 지난 글에서는 오즈비를 사용할 수밖에 없는 경우에 대해 살펴보았다.  상대위험도가 직관적으로 이해하기 쉽고 위험비에 대한 쉬운 해석을 가능하게 하지만, 그럼에도 불구하고 보건 or 의학 계열에서 오즈비를 많이 사용 할 수밖에 없는 이유에 대해 살펴보았다. 또한 오즈비와 상대위험도는 가끔 동일하게 해석되기도 한다. (자세한 내용은 이전 글로..) 그럼 이번 글에서는 오즈비와 상대위험도를 동일하게 해석할 수 있는 경우 에 대해 살펴보도록 하겠다. 먼저 다음과 같은 오즈비의 특성을 이해해야 한다. 오즈비의 중요 특성: 상대적인 위험도를 과장하는 측면 이 있다. 이는 굉장히 중요한 오즈비의 특성인데, Relative Risk 값보다 항상 큰 값을 가진다. 그리고 이는 해당 Event가 흔하게 일어날 수록 더욱 더 과장 된다. 📋예를 들어 보자. 따듯한 차를 마셨을 때와 방안 온도의 차를 마셨을 때 체온이 상승하는지 아니면 그대로 유지되는지에 대해 조사하고 다음과 같은 분할표를 얻었다.   체온 상승 유지 Total Warm tea 90 10 100 Normal temp 20 180 200 먼저 Relative Risk 상대위험도 를 구해보자. $$ \frac{90/100}{20/200} = 9 $$ 이번엔 Odds Ratio 오즈비 를 구해보자. (유도과정은 이전 글 참고) $$ \frac{90 * 180}{20 * 10} = 81 $$ 이번엔 방금 구한 상대위험도와 오즈비를 해석해보자. 📉 RR : 상대위험도는 9로, 이는 따듯한 차를 마신다면 체온이 상승할 확률이 방안 온도의 차를 마셨을 때보다 체온이 상승할 확률...