본문으로 건너뛰기
S
StatMate
블로그 목록
사용 가이드16 min read2026-02-19

카이제곱 검정 실행 방법 — 단계별 가이드

카이제곱 독립성 검정을 처음부터 끝까지 수행하는 방법을 알아봅니다. 분할표 작성, 기대빈도 계산, 검정 통계량 산출, 결과 해석까지 실제 예제와 함께 단계별로 설명합니다.

소개

카이제곱 독립성 검정(Chi-Square Test of Independence)은 두 개의 범주형 변수 사이에 통계적으로 유의한 관련성이 있는지를 검정하는 비모수 통계 기법입니다. 예를 들어, "흡연 여부와 폐질환 발병 사이에 관련이 있는가?", "성별에 따라 선호하는 브랜드가 다른가?"와 같은 연구 질문에 사용됩니다.

이 검정은 관측된 빈도(실제 데이터)와 기대빈도(두 변수가 독립이라면 예상되는 빈도)의 차이를 계산하여, 그 차이가 우연으로 설명하기 어려운 수준인지를 판단합니다. 카이제곱 검정은 사회과학, 의학, 마케팅 등 다양한 분야에서 폭넓게 활용되는 기본적인 통계 도구입니다.

이 가이드에서는 카이제곱 독립성 검정의 모든 단계를 실제 예제와 함께 상세히 안내합니다. StatMate의 카이제곱 검정 계산기를 활용하면 분할표를 입력하는 것만으로 검정 통계량, p-값, 효과 크기를 자동으로 계산할 수 있습니다.

카이제곱 독립성 검정을 사용해야 하는 상황

카이제곱 독립성 검정은 다음 조건을 만족할 때 적합합니다.

  • 두 변수 모두 범주형이어야 합니다 (명목 또는 서열 척도)
  • 독립 표본이어야 합니다 (각 관측치가 하나의 셀에만 속함)
  • 빈도 데이터를 사용합니다 (비율이나 평균이 아닌 개수)

연속형 종속변수의 집단 간 차이를 비교하려면 t-검정이나 ANOVA를 사용해야 합니다.

1단계: 연구 가설 설정

카이제곱 독립성 검정의 가설은 다음과 같습니다.

  • 귀무가설(H₀): 두 범주형 변수는 독립이다 (관련이 없다).
  • 대립가설(H₁): 두 범주형 변수는 독립이 아니다 (관련이 있다).

예를 들어, "성별과 운동 유형 선호는 서로 독립이다"가 귀무가설이 됩니다.

2단계: 가정 검증

카이제곱 검정이 적절하려면 다음 가정을 확인해야 합니다.

가정 1: 기대빈도의 최소 크기

| 조건 | 기준 | 위반 시 대안 | |------|------|-------------| | 모든 셀의 기대빈도 | 5 이상 | Fisher 정확 검정 사용 | | 기대빈도 5 미만인 셀 비율 | 전체 셀의 20% 미만 | 범주 병합 또는 Fisher 검정 | | 2x2 분할표 | 모든 기대빈도 5 이상 | Yates 연속성 보정 또는 Fisher 검정 |

기대빈도가 너무 작으면 카이제곱 근사가 정확하지 않습니다. 이 경우 Fisher 정확 검정이 더 적합합니다.

가정 2: 독립 관측

각 참가자나 사례가 분할표의 정확히 하나의 셀에만 기여해야 합니다. 반복 측정이나 짝을 이룬 데이터에는 McNemar 검정을 사용합니다.

가정 3: 충분한 표본 크기

전체 표본 크기가 너무 작으면 검정력이 부족합니다. 일반적으로 전체 N이 20 이상이어야 합니다.

3단계: 예제 데이터 준비

한 대학교에서 학년(1학년, 2학년, 3학년)에 따라 선호하는 수업 방식(대면, 온라인, 혼합)이 다른지 조사했습니다. 총 300명의 학생을 대상으로 설문을 실시했습니다.

관측 빈도 (분할표)

| | 대면 수업 | 온라인 수업 | 혼합 수업 | 행 합계 | |---|---------|-----------|---------|--------| | 1학년 | 45 | 35 | 20 | 100 | | 2학년 | 30 | 40 | 30 | 100 | | 3학년 | 25 | 25 | 50 | 100 | | 열 합계 | 100 | 100 | 100 | 300 |

4단계: 기대빈도 계산

기대빈도는 두 변수가 완전히 독립이라면 각 셀에서 예상되는 빈도입니다.

기대빈도 공식: Eᵢⱼ = (행 합계ᵢ × 열 합계ⱼ) / 전체 합계

기대빈도 계산 과정

| 셀 | 계산 | 기대빈도 | |----|------|---------| | 1학년-대면 | (100 × 100) / 300 | 33.33 | | 1학년-온라인 | (100 × 100) / 300 | 33.33 | | 1학년-혼합 | (100 × 100) / 300 | 33.33 | | 2학년-대면 | (100 × 100) / 300 | 33.33 | | 2학년-온라인 | (100 × 100) / 300 | 33.33 | | 2학년-혼합 | (100 × 100) / 300 | 33.33 | | 3학년-대면 | (100 × 100) / 300 | 33.33 | | 3학년-온라인 | (100 × 100) / 300 | 33.33 | | 3학년-혼합 | (100 × 100) / 300 | 33.33 |

이 예제에서는 행 합계와 열 합계가 모두 같으므로 모든 셀의 기대빈도가 동일하게 33.33입니다.

가정 확인: 모든 기대빈도가 33.33으로 5 이상이므로 카이제곱 검정을 적용할 수 있습니다.

5단계: 카이제곱 통계량 계산

카이제곱 통계량 공식: χ² = Σ (Oᵢⱼ − Eᵢⱼ)² / Eᵢⱼ

각 셀의 기여 값

| 셀 | 관측(O) | 기대(E) | (O−E)² | (O−E)²/E | |----|--------|--------|--------|----------| | 1학년-대면 | 45 | 33.33 | 136.09 | 4.08 | | 1학년-온라인 | 35 | 33.33 | 2.79 | 0.08 | | 1학년-혼합 | 20 | 33.33 | 177.69 | 5.33 | | 2학년-대면 | 30 | 33.33 | 11.09 | 0.33 | | 2학년-온라인 | 40 | 33.33 | 44.49 | 1.33 | | 2학년-혼합 | 30 | 33.33 | 11.09 | 0.33 | | 3학년-대면 | 25 | 33.33 | 69.39 | 2.08 | | 3학년-온라인 | 25 | 33.33 | 69.39 | 2.08 | | 3학년-혼합 | 50 | 33.33 | 277.89 | 8.34 |

χ² = 4.08 + 0.08 + 5.33 + 0.33 + 1.33 + 0.33 + 2.08 + 2.08 + 8.34 = 23.98

자유도

df = (행 수 − 1) × (열 수 − 1) = (3 − 1) × (3 − 1) = 4

p-값

χ²(4) = 23.98에 대한 p-값은 p < .001입니다.

6단계: 효과 크기 계산

Cramer's V

카이제곱 검정에서 효과 크기는 주로 Cramer's V를 사용합니다.

V = √(χ² / (N × (min(r, c) − 1)))

V = √(23.98 / (300 × (3 − 1))) = √(23.98 / 600) = √0.04 = 0.200

Cramer's V 해석 기준

df* = min(행 수, 열 수) − 1에 따라 해석 기준이 달라집니다.

| | 작은 효과 | 중간 효과 | 큰 효과 | |---|---------|---------|---------| | df* = 1 | .10 | .30 | .50 | | df* = 2 | .07 | .21 | .35 | | df* = 3 | .06 | .17 | .29 |

이 예제에서 df* = 2이고 V = .200이므로 중간에 가까운 효과에 해당합니다.

결과 해석 방법

APA 형식 보고

카이제곱 독립성 검정 결과, 학년과 선호하는 수업 방식 사이에 통계적으로 유의한 관련성이 있었다, χ²(4, N = 300) = 23.98, p < .001, Cramer's V = .200. 1학년은 대면 수업을, 3학년은 혼합 수업을 선호하는 경향이 관찰되었다.

결과를 풍부하게 해석하는 방법

  1. 통계적 유의성 확인: χ² = 23.98, p < .001이므로 학년과 수업 방식 선호는 독립이 아닙니다.
  2. 효과 크기 평가: V = .200으로 작지 않은 실질적 관련성이 있습니다.
  3. 셀별 기여 분석: (O−E)²/E 값이 큰 셀을 확인하여 관련성의 패턴을 파악합니다.
    • 3학년-혼합(8.34)과 1학년-혼합(5.33)이 가장 큰 기여를 했습니다.
    • 이는 3학년이 혼합 수업을 기대 이상으로 선호하고, 1학년은 혼합 수업을 기대 이하로 선호한다는 뜻입니다.
  4. 잔차 분석: 표준화 잔차(Adjusted Standardized Residual)가 ±1.96 이상인 셀에서 유의한 편차가 있다고 해석합니다.

비유의적 결과인 경우

카이제곱 독립성 검정 결과, 학년과 수업 방식 선호 사이에 통계적으로 유의한 관련성이 관찰되지 않았다, χ²(4, N = 300) = 5.42, p = .247, Cramer's V = .095. 학년에 따른 수업 방식 선호의 차이는 통계적으로 유의하지 않았다.

StatMate로 카이제곱 검정 실행하기

StatMate의 카이제곱 검정 계산기를 사용하면 간편하게 분석할 수 있습니다.

  1. 카이제곱 검정 계산기 페이지에 접속합니다.
  2. 행과 열의 수를 설정합니다 (이 예제에서는 3x3).
  3. 각 행과 열의 이름을 입력합니다.
  4. 분할표의 관측 빈도를 입력합니다.
  5. 계산 버튼을 클릭합니다.
  6. 결과에서 χ² 통계량, 자유도, p-값, Cramer's V를 확인합니다.
  7. 기대빈도표와 셀별 기여도도 자동으로 제공됩니다.
  8. APA 형식 결과를 복사하거나 PDF로 내보낼 수 있습니다.

카이제곱 검정의 변형

| 검정 유형 | 사용 상황 | StatMate 지원 | |----------|----------|-------------| | 독립성 검정 | 두 범주형 변수의 관련성 | 카이제곱 계산기 | | 적합도 검정 | 관측 분포가 기대 분포와 일치하는지 | 카이제곱 계산기 | | Fisher 정확 검정 | 기대빈도가 작은 2x2 표 | Fisher 정확 검정 계산기 | | McNemar 검정 | 대응표본(전후 비교) | McNemar 검정 계산기 |

자주 묻는 질문 (FAQ)

기대빈도가 5 미만인 셀이 있으면 어떻게 하나요?

기대빈도가 5 미만인 셀이 전체 셀의 20%를 초과하면 카이제곱 근사가 부정확합니다. 세 가지 대안이 있습니다.

  1. 범주 병합: 이론적으로 의미 있는 범주끼리 합쳐서 기대빈도를 높입니다.
  2. Fisher 정확 검정: 2x2 분할표에서는 Fisher 검정이 표준적 대안입니다.
  3. 추가 데이터 수집: 표본 크기를 늘려 기대빈도를 높입니다.

2x2 분할표에서 Yates 보정은 필수인가요?

2x2 분할표에서 Yates 연속성 보정을 적용하면 χ² 값이 작아지고 p-값이 커져서 보수적인 결과를 냅니다. 일부 통계학자는 Yates 보정이 지나치게 보수적이라고 비판합니다. 현재 추세는 표본이 작을 때는 Fisher 정확 검정을, 표본이 클 때는 보정 없는 카이제곱 검정을 사용하는 것입니다.

카이제곱 검정에서 방향성을 알 수 있나요?

기본적인 카이제곱 검정은 관련성의 존재 여부만 알려주고 방향은 알려주지 않습니다. 관련성의 패턴을 확인하려면 다음을 활용하세요.

  • 셀별 관측빈도와 기대빈도 비교: 어느 셀에서 기대보다 많거나 적은지 확인
  • 표준화 잔차 분석: ±1.96 이상이면 해당 셀에서 유의한 편차
  • 행 백분율 또는 열 백분율: 각 범주 내에서의 분포 패턴 비교

서열 변수에도 카이제곱 검정을 쓸 수 있나요?

카이제곱 검정은 서열 변수에도 적용 가능하지만, 서열 정보(순서)를 활용하지 않는다는 한계가 있습니다. 두 서열 변수 간 관련성을 분석한다면 감마(Gamma) 계수나 Kendall의 타우(τ) 같은 서열 상관 측도가 더 적합할 수 있습니다.

표본 크기가 너무 크면 어떤 문제가 생기나요?

표본 크기가 매우 크면(예: N > 10,000) 실질적으로 의미 없는 작은 관련성도 통계적으로 유의하게 나올 수 있습니다. 이럴 때 효과 크기(Cramer's V)가 특히 중요합니다. V 값이 .10 미만이라면 통계적으로 유의하더라도 실질적 의미는 제한적입니다.

다중 비교 문제는 어떻게 처리하나요?

3x3 이상의 분할표에서 유의한 결과가 나왔을 때 어느 셀이 기여하는지 알고 싶다면, 사후 검정으로 하위 분할표(2x2)를 비교할 수 있습니다. 이때 Bonferroni 보정으로 유의수준을 조정해야 합니다. 예를 들어, 3개의 하위 비교를 하면 α = .05/3 = .017로 보정합니다.

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.