범주형 변수 (categorical variables)의 정의와 예시에 대해 살펴보고 다음 글부터 범주형 변수의 분석 방법에 대해 다루고자 한다.
✅범주형 변수의 정의: 측정 단위가 여러 범주들의 집합으로 구성되어 있는 변수
범주형 변수는 질적 변수 (qualitative variables) 라고도 일컬어 진다.
📋범주형 변수의 예시
ex 1) 영화장르: 액션 - 로코 - 코미디 - 드라마
ex 2) 백신 접종 여부: 예 - 아니오
ex 3) 최종 학력: 중졸 - 고졸 - 전문대졸 - 대졸 - 대학원졸
ex 4) 행복 수준: 없음 - 가끔 - 꽤 행복 - 항상 행복
범주형 변수는 하위 세 가지 타입의 변수를 갖는다.
1. 이항변수 (Binary variables)
⇨ 위 예시 2번이 해당
⇨ [예 or 아니오] 혹은 [찬성 or 반대] 두 가지의 범주만을 갖는 변수들
2. 명목형변수 (Nominal variables)
⇨ 위 예시 1번이 해당
⇨ 3개 이상의 범주를 갖고 변수들 사이에 순서에 대한 의미가 없는 변수들
3. 순서형변수 (Ordinal variable)
⇨ 위 예시 3번과 4번이 해당
⇨ 범주들이 일정한 순서를 갖는 변수들 (순서에 의미가 있음)
범주형 변수들을 어떻게 분석할 것인가?
⇨ GLM (Generalised Linear Model) 일반화 선형모형 이용함.
자세한 분석 방법들은 다음 글들에서 다루고자 한다.
댓글
댓글 쓰기