본문으로 건너뛰기
S
StatMate
블로그 목록
검정 비교16 min read2026-02-19

카이제곱 검정 vs Fisher 정확 검정: 어떤 검정을 사용해야 할까?

범주형 데이터 분석에서 카이제곱 검정과 Fisher 정확 검정을 언제 사용해야 하는지 비교합니다. 기대빈도 조건, 소표본 처리, 실제 데이터 예제, APA 보고 방식까지 체계적으로 안내합니다.

소개: 범주형 변수 간 관련성 검정

두 범주형 변수 사이에 관련성이 있는지 확인하는 것은 다양한 연구 분야에서 빈번하게 발생하는 분석 과제입니다. 성별에 따라 선호하는 브랜드가 다른지, 약물 투여 여부에 따라 치료 성공률이 다른지 등의 질문이 이에 해당합니다.

이러한 질문에 답하기 위해 가장 많이 사용되는 두 가지 검정이 카이제곱(Chi-square) 독립성 검정과 **Fisher 정확 검정(Fisher's exact test)**입니다. 두 검정 모두 교차표(contingency table)를 분석하지만, 적용 조건과 계산 방법이 다릅니다.

이 글에서는 두 검정의 원리를 비교하고, 어떤 상황에서 어떤 검정을 선택해야 하는지 명확한 기준을 제시합니다.

핵심 비교 요약

| 특성 | 카이제곱 검정 | Fisher 정확 검정 | |------|-------------|-----------------| | 계산 방법 | 근사(approximation) | 정확(exact) | | 표본 크기 제한 | 대표본 필요 | 소표본에서도 정확 | | 기대빈도 조건 | 모든 셀에서 5 이상 | 조건 없음 | | 교차표 크기 | 모든 크기 가능 | 전통적으로 2x2, 확장 가능 | | 계산 속도 | 빠름 | 대표본 시 느릴 수 있음 | | 검정 통계량 | 카이제곱 (chi-square) 통계량 | 직접 p 값 계산 | | 효과크기 | Cramer의 V, 파이 계수 | 오즈비(Odds Ratio) |

카이제곱 독립성 검정의 원리

카이제곱 검정은 관측빈도와 기대빈도의 차이를 이용합니다. 두 변수가 독립적이라면(관련이 없다면), 각 셀의 관측빈도는 기대빈도와 비슷할 것입니다.

기본 공식:

chi-square = 합계 [(관측빈도 - 기대빈도)^2 / 기대빈도]

기대빈도는 각 셀의 행 합계와 열 합계를 곱한 후 전체 합계로 나누어 계산합니다.

StatMate 카이제곱 검정 계산기에서 직접 확인해보세요.

카이제곱 검정의 가정

  1. 독립성: 각 관측치가 독립적 (한 사람이 한 셀에만 기여)
  2. 기대빈도 조건: 모든 셀의 기대빈도가 5 이상
  3. 충분한 표본 크기: 전체 N이 충분히 클 것 (일반적으로 20 이상)

기대빈도 조건은 카이제곱 분포에 대한 근사가 정확하려면 필요합니다.

Fisher 정확 검정의 원리

Fisher 정확 검정은 카이제곱 근사를 사용하지 않고, **초기하분포(hypergeometric distribution)**를 이용하여 p 값을 직접 계산합니다. 행 합계와 열 합계가 고정되었을 때, 관측된 분포만큼 극단적이거나 더 극단적인 모든 경우의 확률을 합산합니다.

이 방법은 표본 크기에 상관없이 정확한 p 값을 제공하므로, 기대빈도 조건을 걱정할 필요가 없습니다.

StatMate Fisher 정확 검정 계산기에서 직접 확인해보세요.

Fisher 정확 검정의 가정

  1. 독립성: 각 관측치가 독립적
  2. 고정된 주변합: 행 합계와 열 합계가 고정 (실험 설계에서 자연스럽게 충족)

정규성이나 기대빈도에 대한 가정이 없습니다.

예제 1: 기대빈도 충족 — 대표본

한 제약회사가 새로운 약물의 효과를 검증하기 위해 200명의 환자를 약물군(100명)과 위약군(100명)으로 무작위 배정했습니다. 결과는 다음과 같습니다.

관측빈도 (교차표)

| | 호전 | 미호전 | 합계 | |---|---|---|---| | 약물군 | 68 | 32 | 100 | | 위약군 | 45 | 55 | 100 | | 합계 | 113 | 87 | 200 |

기대빈도

| | 호전 | 미호전 | |---|---|---| | 약물군 | 56.50 | 43.50 | | 위약군 | 56.50 | 43.50 |

모든 셀의 기대빈도가 5 이상이므로 카이제곱 검정이 적합합니다.

두 검정 결과 비교

| 검정 | 통계량 | p 값 | |------|--------|------| | 카이제곱 검정 | chi-square(1) = 10.74 | .001 | | Fisher 정확 검정 | — | .001 |

대표본에서 두 검정의 p 값은 거의 동일합니다. 이 경우 카이제곱 검정의 결과를 보고하는 것이 일반적입니다.

효과크기

| 효과크기 | 값 | 해석 | |---------|-----|------| | 파이 계수 (Phi) | .232 | 작은~중간 효과 | | 오즈비 (OR) | 2.60 | 약물군의 호전 오즈가 2.60배 |

오즈비 2.60은 약물군이 위약군에 비해 호전될 확률이 약 2.6배 높다는 것을 의미합니다.

예제 2: 기대빈도 미충족 — 소표본

희귀 질환 연구에서 신규 치료법의 효과를 확인합니다. 전체 환자 수가 20명뿐이며, 치료군 10명, 대조군 10명입니다.

관측빈도 (교차표)

| | 완치 | 미완치 | 합계 | |---|---|---|---| | 치료군 | 8 | 2 | 10 | | 대조군 | 3 | 7 | 10 | | 합계 | 11 | 9 | 20 |

기대빈도

| | 완치 | 미완치 | |---|---|---| | 치료군 | 5.50 | 4.50 | | 대조군 | 5.50 | 4.50 |

기대빈도가 모두 5 이상이지만 전체 표본이 20명으로 작습니다. 기대빈도가 5에 근접한 셀이 있어 카이제곱 근사의 정확도가 떨어질 수 있습니다.

두 검정 결과 비교

| 검정 | 통계량 | p 값 | |------|--------|------| | 카이제곱 검정 (Yates 보정 미적용) | chi-square(1) = 5.05 | .025 | | 카이제곱 검정 (Yates 보정 적용) | chi-square(1) = 3.64 | .056 | | Fisher 정확 검정 | — | .070 |

소표본에서 세 가지 방법의 결론이 다릅니다. Yates 보정 없는 카이제곱은 유의(p = .025)하지만, Yates 보정 카이제곱(p = .056)과 Fisher 정확 검정(p = .070)은 유의하지 않습니다. 소표본에서는 Fisher 정확 검정의 결과를 따르는 것이 가장 안전합니다.

예제 3: 기대빈도 5 미만 — Fisher 필수

더 작은 표본의 예시입니다. 특정 유전자 변이와 약물 부작용의 관계를 15명에서 조사합니다.

관측빈도 (교차표)

| | 부작용 발생 | 부작용 미발생 | 합계 | |---|---|---|---| | 변이 보유 | 4 | 1 | 5 | | 변이 미보유 | 2 | 8 | 10 | | 합계 | 6 | 9 | 15 |

기대빈도

| | 부작용 발생 | 부작용 미발생 | |---|---|---| | 변이 보유 | 2.00 | 3.00 | | 변이 미보유 | 4.00 | 6.00 |

기대빈도 중 2.00이 5 미만이므로 카이제곱 검정은 부적절합니다. 반드시 Fisher 정확 검정을 사용해야 합니다.

Fisher 정확 검정 결과

| 통계량 | 값 | |--------|-----| | p 값 (양측) | .049 | | 오즈비 (OR) | 16.00 | | 95% 신뢰구간 | [1.05, 524.90] |

p = .049로 유의수준 .05에서 유의합니다. 유전자 변이 보유자의 부작용 발생 오즈가 16배 높으나, 신뢰구간이 매우 넓어(표본이 작으므로) 추가 연구가 필요합니다.

검정 선택 의사결정 기준

기대빈도 기반 규칙

| 조건 | 권장 검정 | |------|----------| | 모든 셀의 기대빈도 >= 5 | 카이제곱 검정 | | 기대빈도 5 미만인 셀이 20% 이상 | Fisher 정확 검정 | | 어떤 셀의 기대빈도 < 1 | Fisher 정확 검정 (필수) | | 전체 N < 20 | Fisher 정확 검정 | | 2x2 표에서 N < 40 | Fisher 정확 검정 |

실용적 판단 기준

  1. 2x2 교차표이고 표본이 작다면 → Fisher 정확 검정
  2. 표본이 충분하고 기대빈도 조건 충족 → 카이제곱 검정
  3. 확실하지 않다면 → Fisher 정확 검정 (항상 정확하므로 안전)

Yates 연속성 보정에 대하여

2x2 교차표에서 카이제곱 검정을 사용할 때, Yates 연속성 보정을 적용할지 여부가 논란이 됩니다.

| 방법 | 특징 | |------|------| | 보정 미적용 | 표준적 카이제곱, 약간 자유로움 | | Yates 보정 적용 | 보수적, 1종 오류 줄임 | | Fisher 정확 검정 | 보정 불필요, 항상 정확 |

현대 통계학에서는 Yates 보정 대신 Fisher 정확 검정을 사용하는 것이 더 선호됩니다. 컴퓨터의 발전으로 Fisher 정확 검정의 계산이 더 이상 문제가 되지 않기 때문입니다.

2x2 이상의 교차표

Fisher 정확 검정은 전통적으로 2x2 표에서 사용되었지만, 현대적 구현에서는 r x c 표에서도 사용할 수 있습니다. 다만 표의 크기가 커지면 계산량이 급격히 증가합니다.

| 교차표 크기 | 카이제곱 적합성 | Fisher 실용성 | |-----------|---------------|-------------| | 2x2 | 기대빈도 5 이상 | 항상 가능 | | 2x3 | 기대빈도 조건 확인 | 가능, 계산량 보통 | | 3x3 이상 | 기대빈도 조건 확인 | 가능하나 계산량 증가 | | 5x5 이상 | 대부분 적합 | 계산량이 매우 클 수 있음 |

대규모 교차표에서 기대빈도 조건이 부분적으로 위반되면, 인접 범주를 합치는 것도 하나의 방법입니다.

APA 형식 보고 방법

카이제곱 검정 보고

카이제곱 독립성 검정 결과, 약물 투여와 치료 호전 간에 유의한 관련성이 있었다, chi-square(1, N = 200) = 10.74, p = .001, phi = .23.

Fisher 정확 검정 보고

Fisher 정확 검정 결과, 유전자 변이 보유와 부작용 발생 간에 유의한 관련성이 있었다, p = .049, OR = 16.00, 95% CI [1.05, 524.90].

Fisher 정확 검정에서는 카이제곱 통계량이 없으므로 p 값과 오즈비를 직접 보고합니다.

자주 묻는 질문 (FAQ)

Q1: 기대빈도가 정확히 5인 셀이 있으면 어떻게 하나요?

기대빈도가 정확히 5이면 카이제곱 검정을 사용할 수 있습니다. 기준은 "5 미만"인 셀의 비율입니다. 경계선에 있다면 두 검정을 모두 실행하여 결론이 동일한지 확인하는 것이 좋습니다.

Q2: 카이제곱 검정에서 자유도는 어떻게 결정되나요?

자유도 = (행의 수 - 1) x (열의 수 - 1)입니다. 2x2 표의 자유도는 1, 3x2 표의 자유도는 2, 3x3 표의 자유도는 4입니다.

Q3: Fisher 정확 검정이 항상 정확하다면 왜 카이제곱 검정을 사용하나요?

대표본에서 두 검정의 결과는 거의 동일하며, 카이제곱 검정은 카이제곱 통계량이라는 직관적인 지표를 제공합니다. 또한 교차표가 크면(5x5 이상) Fisher 정확 검정의 계산 비용이 크게 증가할 수 있습니다. 기대빈도 조건이 충족되면 카이제곱 검정을 사용해도 전혀 문제가 없습니다.

Q4: 오즈비(OR)와 상대위험도(RR)는 어떻게 다른가요?

오즈비는 두 집단의 오즈의 비율이고, 상대위험도는 확률의 비율입니다. 결과 발생률이 낮을 때(10% 미만) 두 값은 유사합니다. Fisher 정확 검정은 일반적으로 오즈비를 보고하며, 코호트 연구에서는 상대위험도가 더 직관적일 수 있습니다.

Q5: 관측빈도가 0인 셀이 있으면 어떻게 하나요?

0인 셀이 있으면 카이제곱 검정은 문제가 생길 수 있습니다. Fisher 정확 검정은 0인 셀에서도 정확하게 작동합니다. 따라서 0인 셀이 있는 경우 반드시 Fisher 정확 검정을 사용하세요.

Q6: McNemar 검정과 카이제곱/Fisher 검정은 어떤 관계인가요?

McNemar 검정은 **대응표본(paired samples)**에서 범주형 변수의 변화를 검정합니다. 예를 들어, 같은 사람의 치료 전-후 반응 변화를 분석합니다. 카이제곱과 Fisher 정확 검정은 독립표본에서 사용됩니다. 대응 표본이라면 McNemar 검정이 적합합니다.

직접 해보기

StatMate에서 두 검정을 직접 실행해볼 수 있습니다.

교차표 데이터를 입력하면 기대빈도를 자동으로 계산하여, 카이제곱 검정이 적합한지 Fisher 정확 검정이 필요한지를 즉시 확인할 수 있습니다.

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.