오즈비의 성질 Odds Ratio 기본 콘텐츠로 건너뛰기

오즈비의 성질 Odds Ratio

  오즈비는 임상에서 굉장히 많이 사용되는 개념이기도 하고, 로지스틱 회귀에서도 모형의 해석에서 굉장히 중요한 개념이다. 오즈비는 처음에는 이해하기 어렵지만, 이해를 하고나면 그 다음부터 쉽게 해석할 수 있고, 오즈비가 가진 여러 성질들도 이해할 수 있다.


 📋오즈비의 성질을 살펴보기 위해 아래와 같은 표를 만들었다.


Infarction
Yes No Total
Drug Used 28 41 69
Never 35 132 167
Total 63 173 236



📉 먼저 위 표를 바탕으로 상대위험도(Relative Risk)를 구해보자.
Drug used 그룹에서 Infarction Yes의 비율을 구해보자
 ⇨ Infarction Yes : 28/69 =  𝛑1

✔ 이번에는 Drug never used 그룹에서 Infarction Yes의 비율을 구해보자
 ⇨ Infarction Yes : 35/167 = 𝛑2

❗이 경우 상대위험도(Relative Risk; RR)는 다음과 같다.

RR𝛑/ 𝛑= (28/69) / (35/167)



📈 이번에는 Odds를 구해보자

Drug used 그룹의 Odds = Odds1 라고 한다면
 Odds1 = 𝛑1/(1-𝛑1) = 28/41

Drug never used 그룹의 Odds = Odds2 라고 한다면
 Odds2 = 𝛑2/(2-𝛑2) = 35/132

❗ 따라서 오즈비(Odds Ratio)는 다음과 같다. 

OR = (28*132)/(41*35) = 2.576



위에서 상대위험도와 오즈비를 기초로 구하였고, 이제 본격적으로 오즈비의 성질에 대해 살펴보도록 한다.

오즈비를 θ 라 하자.
Drug use 여부를 X, Infarction 여부를 Y 라고 하자.


(1) 오즈비의 첫 번째 성질

두 변수 XY 가 서로 독립일 때 ➞ 즉,  𝛑𝛑2 ➞ Odds1=Odds2 ➞ θ = 1


정리하면,
θ = 1 ➞ 두 변수 X 와 Y 가 독립

θ > 1 ➞ 첫 번째 행(=Drug use 그룹)에서의 성공의 Odds가 두 번째 행(=Drug X)의 Odds 보다 크다. ➞ 𝛑1 > 𝛑2

θ < 1 ➞ 첫 번째 행(=Drug use 그룹)에서의 성공의 Odds가 두 번째 행(=Drug X)의 Odds 보다 작다. ➞ 𝛑1 < 𝛑2


❗ 위에서 구한 오즈비는 2.576으로 독립이 아니라고 할 수 있다.



(2) 오즈비의 두 번째 성질

❗ θ 가 1에서 멀어질수록 더 강한 연관성을 나타낸다. 

✔ θ 가 1 보다 클 때 (θ > 1)
오즈비가 4라는 것은 오즈비가 2일 때에 비해 독립성에서 더 멀어진 것이다.

✔ θ 가 1 보다 작을 때 (θ < 1)
0.25의 오즈비는 0.5의 오즈비를 갖는 경우보다 독립성에서 더 멀어진 것이다.

서로 역수 관계에 있는 오즈비방향만 반대일 뿐, 같은 정도의 연관성을 나타낸다.

if θ = 0.25 = Odds1이 Odds2의 0.25배
0.25의 역수는 1/(0.25)=4 이므로 Odds2가 Odds1의 4배라는 의미이다.




만약 행이 바뀌거나 열이 바뀐다면?

-먼저 행이 바뀌는 경우를 살펴보자.

Infarction
Yes No Total
Drug Never 35 132 167
Used 28 41 69
Total 63 173 236


Drug never used 그룹의 Odds = Odds1 = 28/41
Drug used 그룹의 Odds = Odds2 = 35/132

오즈비 = (35*41)/(28*132) = Odds1/Odds2 = 0.39 = 2.576 의 역수 = 1/2.576

따라서 Drug never used 그룹의 Odds는 Drug used 그룹의 Odds에 비해 0.39배이다.
이를 다르게 표현하면 Drug used 그룹의 Odds는 Drug never used 그룹의 "0.39의 역수"인 2.576배 이다.

따라서 행이 바뀌거나 혹은 열이 바뀌면 오즈비는 역수가 된다.




만약 행과 열이 서로 바뀐다면?

-행을 반응변수로 열을 설명변수로 다루거나, 행을 설명변수로 열을 반응변수로 다루더라도 오즈비는 변함이 없다.

댓글

이 블로그의 인기 게시물

Radiomics: Feature selection 3

  Demircioğlu, Aydin PhD  Benchmarking Feature Selection Methods in Radiomics, Investigative Radiology: January 18, 2022 - Volume - Issue - doi: 10.1097/RLI.0000000000000855 High dimensionality of the datasets and small sample sizes are critical problems in radiomics. Therefore, removing redundant features and irrelevant features is needed. Overall, per dataset,  30 different feature selection methods + 10 classifiers + 70 hyperparameter settings After each feature selection method, 1, 2, ..., 64 features were selected. Altogether, 14,700=30✕70 ✕7 models were fitted, each with a 10-fold cross-validation . More complex methods are more unstable than simpler feature selection methods. LASSO performed best when analysing the predictive performance , though it showed only average feature stability . Longer training times and higher computational complexity of the feature selection method do not mean for high predictive performance necessarily. Obtaining a more stable mode...

일치도 통계와 paired t-test

Why using a paired t test to assess agreement is problematic? by Nikolaos Pandis https://doi.org/10.1016/j.ajodo.2021.07.001 Agreement 를 평가함에 있어 paired t-test를 사용하는 논문들이 몇 있다.  임상논문에서 의료기기가 측정한 것의 일치성, 혹은 의료행위자 A와 B가 측정한 것이 비슷한지를 측정하는 일들이 꽤 많은데, 여전히 많은 논문들에서 paired t-test에서 p>0.05 라는 통계 결과를 얻었을 때 '두 기기에서 측정한 수치는 일치한다.' 혹은 '의사A와 의사B가 측정한 수치는 일치한다.' 라는 결과를 내린다. 통계를 배울 때, "짝지어진 두 모집단의 차이를 보고 싶을 때는 paired t-test를 사용한다." 라고 많이들 배우는데, 아마 이렇게 배우기(?) 때문에 '그럼 paired t-test의 p-value가 0.05보다 크면 두 집단 간 차이가 없다는 것이겠네?'라고 많은 사람들의 생각이 이어지는듯하다. 그러나 내가 통계적으로 살펴보고 싶은 것이 "Agreement"라면 paired t-test를 사용하는 것은 잘못 되었다. 그 이유에 대해서는 다음 두 개의 시나리오를 이용해 설명해보도록 하겠다. 시나리오A와 시나리오B에는 시간 차이를 두고 같은 subject를 측정한 Time1 수치와 Time2 수치가 있다. 시나리오A와 시나리오B 모두 Time1과 Time2에서 측정된 수치의 평균은 10.45로 동일하다. ✔️먼저 시나리오A 를 살펴보자. 시나리오A에서 Time1과 Time2의 평균은 10.45로 동일하므로, 차이 d의 평균도 0이고 따라서 paired t-test를 진행하면 p-value가 1로 나올 것이다.  그럼 Time1과 Time2가 동일한 수치를 냈다고 결론지을 수 있는가? 시나리오A의 각 subject를 대상으로 시간 차이...

통계검정 : (1) 두 모비율의 추정과 가설검정

 지지율, 실업률, 불량률과 같이 모집단의 비율(p)을 추정하는 문제에 대해 생각해보자. 모집단이 두 개의 배반사건(찬성, 반대)으로 구성되어 있을 때, 찬성 모비율을 p, 반대 모비율을 (1-p)라 칭한다. $$ \widehat{p}=\frac{X}{n} , E(\widehat{p})=p, Var(\widehat{p})=\frac{p(1-p)}{n} $$  이때, 모집단에서 n개의 표본을 뽑으면 찬성자수 X는  표본수 n, 성공률이 p인  이항분포 B(n, p)를 따른다. $$ X \sim B(n, p) $$ E(X)=np, Var(X)=np(1-p) 이므로, $$ E(\frac{X}{n})=p, Var(\frac{X}{n})=\frac{1}{n^{2}}Var(X)=\frac{1}{n^{2}}np(1-p)=\frac{p(1-p)}{n} $$ 자세한 증명은  http://www.stat.yale.edu/Courses/1997-98/101/binom.htm  를 참고하면 된다. 표본크기가 충분히 크다면 표본비율은 정규분포를 따른다. $$ Z = \frac{\widehat{p}-p_{0}}{\sqrt{p_{0}(1-p_{0})/n}} , Z \sim N(0, 1) $$