Bioinformatics with Park-Kleis 기본 콘텐츠로 건너뛰기

라벨이 조건부연관성인 게시물 표시

삼차원 분할표와 심슨의 역설 Simpson's paradox ; 오즈비

  범주형 변수 분석에는 2X2 분할표가 간단하여 많이 사용되는데, 간단한 자료만 있는 것이 아니라 복잡한 자료들이 참 많다.. 3X3 분할표도 굉장히 많이 이용되는데, 예시를 살펴보고 삼차원 분할표는 어떻게 분석할 수 있는지 살펴보도록 하겠다. 📋 3X3 분할표 는 보통 아래와 같이 생겼다. Victims' race Defendants' race 선고 Rate(%) Yes No 백인 백인 53 414 11.3 흑인 11 37 22.9 흑인 백인 0 16 0.0 흑인 4 139 2.8 합 백인 53 430 11.0 흑인 15 176 7.9 위 표에서 먼저 합을 보자. 백인이 사형선고를 받은 비율은 11%, 흑인이 사형선고를 받은 비율은 7.9%이다. 이는 백인이 흑인에 비해 사형선고의 비율이 높다는 의미이다. 뭔가 그동안 보아왔던 것과는 좀 다른 결과이지 않은가? ❗설명변수인 X  와 반응변수인 Y  의 관계를 통계분석 시 주의해야 할 점은 두 변수에 동시에 영향을 주는 " 교란변수 confounding " 이다. 이를 공변량 covariates 이라고도 하는데, 앞으로는 이런 변수들을 공변량이라 하겠다. 🌟 공변량은 설명변수 X  와 반응변수 Y 모두에 연관되어 있다. 굉장히 매우 중요한 문장이다. 📋예를 들어 보자. 흡연자와 같이 사는 비흡연자에게 간접흡연이 미치는 영향을 살펴보는 연구를 하고자 설명변수로는 배우자가 흡연자인지의 여부, 반응변수로는 폐암 발생 여부로 지정했다고 하자. X = 흡연자와의 동거 여부 Y = 폐암 ...