본문으로 건너뛰기
S
StatMate
블로그 목록
통계 기초38 min read2026-03-09

어떤 통계 검정을 사용해야 할까? — 완벽 의사결정 가이드

데이터 유형, 집단 수, 연구 설계에 따라 적합한 통계 검정을 선택하는 방법을 체계적으로 안내합니다. 모수 검정, 비모수 대안, 가정 검정 워크플로, 흔한 선택 실수까지 포괄하는 완벽 가이드입니다.

통계 검정 선택이 중요한 이유

연구 데이터를 수집한 뒤 가장 먼저 부딪히는 질문은 "어떤 통계 분석을 해야 하지?" 입니다. 잘못된 검정을 선택하면 결과 자체가 무의미해지고, 논문 심사에서 거절당하는 원인이 됩니다. 반대로 올바른 검정을 선택하면 데이터가 가진 정보를 정확하게 추출할 수 있습니다.

이 글에서는 통계 검정 선택의 의사결정 프레임워크부터 가정 검정, 구체적인 예시, 종합 참조표까지 체계적으로 안내합니다.

의사결정 프레임워크

통계 검정 선택은 세 가지 질문을 순서대로 던지는 것으로 시작됩니다:

  1. 종속변수의 데이터 유형은? (연속형, 범주형, 순서형)
  2. 독립변수의 데이터 유형은? (집단이 있는 범주형, 또는 연속형)
  3. 몇 개의 집단 또는 변수가 관련되어 있는가?

이 세 질문에 대한 답이 대부분의 선택지를 제거하고 올바른 검정 계열로 안내합니다. 이후 표본 관계(독립 vs. 대응)와 모수적 검정의 가정 충족 여부로 정교화합니다.

핵심 의사결정 표

| 종속변수 유형 | 독립변수 유형 | 집단/변수 수 | 독립표본 | 대응표본 | 비모수 대안 | |-------------|------------|------------|---------|---------|------------| | 연속형 | 범주형 | 1집단 vs 기준값 | 단일표본 t-검정 | — | Wilcoxon 부호순위 | | 연속형 | 범주형 | 2집단 | 독립표본 t-검정 | 대응표본 t-검정 | Mann-Whitney U / Wilcoxon | | 연속형 | 범주형 | 3+집단 | 일원배치 ANOVA | 반복측정 ANOVA | Kruskal-Wallis / Friedman | | 연속형 | 범주형 2개 | 요인 설계 | 이원배치 ANOVA | 혼합 ANOVA | — | | 연속형 | 연속형 | 변수 2개 | Pearson 상관 | — | Spearman 상관 | | 연속형 | 연속형 | 예측변수 1개 | 단순회귀 | — | — | | 연속형 | 혼합 | 예측변수 2+개 | 다중회귀 | — | — | | 이분형 | 혼합 | 예측변수 1+개 | 로지스틱 회귀 | — | — | | 범주형 | 범주형 | 2×2 이상 | 카이제곱 검정 | McNemar 검정 | Fisher 정확검정 | | 순서형 | 범주형 | 2집단 | — | — | Mann-Whitney U / Wilcoxon |

이 표는 학부 및 대학원 수준 연구에서 접하는 분석의 약 90%를 다룹니다.

평균 비교 검정

t-검정을 사용해야 할 때

t-검정 계열은 정확히 두 조건 간의 평균을 비교합니다. 핵심 결정은 두 관찰 집합이 독립적인지 대응인지 여부입니다.

독립표본 t-검정 — 사용 시기:

  • 두 집단이 서로 다른 참가자로 구성
  • 관찰 간 자연적 짝짓기가 없음
  • 예: 실험집단과 통제집단의 시험 점수 비교

대응표본 t-검정 — 사용 시기:

  • 같은 참가자를 두 번 측정
  • 짝으로 매칭된 참가자 (예: 쌍둥이, 부부)
  • 예: 중재 전후의 불안 점수 비교

단일표본 t-검정 — 사용 시기:

  • 표본 평균을 알려진 모집단 값이나 이론적 상수와 비교
  • 예: 우리 학교 학생의 평균 IQ가 100과 다른지 검정

흔한 실수: 대응 데이터에 독립표본 t-검정을 사용하거나 그 반대. 이렇게 하면 자유도, 표준오차, p값이 모두 잘못됩니다. 항상 "두 조건의 관찰값 사이에 일대일 대응을 그릴 수 있는가?"를 자문하세요. 그렇다면 대응 데이터입니다.

ANOVA를 사용해야 할 때

ANOVA는 t-검정을 3개 이상의 집단으로 확장합니다. ANOVA 대신 여러 t-검정을 반복 실시하면 가족별(family-wise) 1종 오류율이 증가합니다. 3개 집단에서 3번의 쌍별 t-검정(α = .05)은 전체 거짓 양성률이 14.3%가 되고, 5개 집단에서 10번의 검정은 40.1%까지 올라갑니다.

일원배치 ANOVA — 사용 시기:

  • 독립변수 1개, 3개 이상의 수준
  • 집단이 독립적
  • 예: 세 가지 교수법(A, B, C)에 따른 성적 차이 비교

이원배치 ANOVA — 사용 시기:

  • 독립변수 2개를 동시에 검토
  • 주효과와 상호작용 효과를 모두 검정하고자 할 때
  • 예: 교수법의 효과가 학생 성별에 따라 다른지 검정

반복측정 ANOVA — 사용 시기:

  • 같은 참가자를 3개 이상의 조건에서 측정
  • 예: 기준선, 1주 후, 4주 후의 통증 수준 측정

혼합 ANOVA — 사용 시기:

  • 집단 간(between-subjects) 요인과 집단 내(within-subjects) 요인이 모두 있을 때
  • 예: 두 치료 집단(집단 간)을 세 시점에서 측정(집단 내)

유의한 ANOVA 결과 후에는 어떤 특정 집단 간에 차이가 있는지 확인하기 위해 사후검정(Tukey HSD, Bonferroni 등)이 필요합니다.

t-검정 vs ANOVA 의사결정

| 상황 | 검정 | 이유 | |-----|------|-----| | 2개 독립 집단 | 독립표본 t-검정 | 더 간단, 2집단 일원배치 ANOVA와 동등 | | 2개 대응 조건 | 대응표본 t-검정 | 참가자 내 상관 반영 | | 3+개 독립 집단 | 일원배치 ANOVA | 가족별 오류율 통제 | | 3+개 대응 조건 | 반복측정 ANOVA | 반복 측정 반영 | | 2+개 독립변수, 반복측정 없음 | 이원(N-원)배치 ANOVA | 주효과와 상호작용 검정 |

평균 비교의 비모수 대안

데이터가 정규성 가정을 위반하거나 순서형 척도를 사용할 때, 비모수 검정이 유효한 대안을 제공합니다:

| 모수 검정 | 비모수 대안 | 전환 시기 | |----------|-----------|---------| | 독립표본 t-검정 | Mann-Whitney U 검정 | 소표본(n < 15/집단), 심한 비대칭, 순서형 데이터 | | 대응표본 t-검정 | Wilcoxon 부호순위 검정 | 비정규 차이값, 순서형 데이터 | | 일원배치 ANOVA | Kruskal-Wallis H 검정 | 비정규 데이터, 불등분산, 순서형 데이터 | | 반복측정 ANOVA | Friedman 검정 | 반복 조건에서의 비정규 데이터 |

비모수 검정은 원래 값 대신 순위를 비교합니다. 가정이 충족될 때는 약간의 검정력을 희생하지만, 가정이 위반될 때는 더 견고합니다. 집단당 30명 이상이고 중간 정도의 비대칭만 있다면 모수적 검정으로 일반적으로 충분합니다.

관련성 및 관계 분석 검정

상관분석

상관분석은 두 연속 변수 간 선형 관계의 강도와 방향을 측정합니다. 데이터 특성에 따라 유형을 선택합니다:

Pearson 상관 (r) — 사용 시기:

  • 두 변수 모두 연속형이고 대략적으로 정규분포
  • 관계가 대략 선형
  • 극단적 이상치가 없음

Spearman 순위 상관 (r_s) — 사용 시기:

  • 하나 이상의 변수가 순서형
  • 관계가 단조(monotonic)이지만 반드시 선형은 아님
  • 데이터에 이상치가 있거나 비대칭

점이연 상관 — 사용 시기:

  • 한 변수는 연속형, 다른 변수는 이분형(이진)
  • 수학적으로 이진 변수를 사용한 Pearson의 r과 동등

회귀분석

회귀분석은 하나 이상의 변수로 다른 변수를 예측하고 예측적 관계를 정량화합니다.

단순 선형회귀 — 연속형 예측변수 1개, 연속형 결과변수 1개. X가 1단위 변할 때 Y가 얼마나 변하는지 정량화할 때 사용.

다중 선형회귀 — 여러 예측변수(연속형 또는 코딩된 범주형), 연속형 결과변수 1개. 다른 변수를 통제하면서 각 예측변수의 고유한 기여를 검토할 때 사용.

로지스틱 회귀 — 하나 이상의 예측변수, 이분형 결과변수(0/1). 종속변수가 두 수준(예: 합격/불합격, 질병/건강)인 범주형일 때 사용. 기울기 계수 대신 승산비(odds ratio)를 보고.

상관 vs 회귀 사용 시기: 두 변수 간 연관의 강도를 방향성 함의 없이 단순히 기술하려면 상관을 사용하세요. 한 변수로 다른 변수를 예측하거나, 원래 단위로 효과를 정량화하거나, 혼란변수를 통제하려면 회귀를 사용하세요.

카이제곱 및 관련 검정

범주형 변수의 경우 카이제곱 계열이 주요 도구입니다:

카이제곱 독립성 검정 — 사용 시기:

  • 두 변수 모두 범주형
  • 한 변수의 분포가 다른 변수의 수준에 따라 다른지 검정
  • 기대 셀 빈도가 대부분의 셀에서 5 이상

카이제곱 적합도 검정 — 사용 시기:

  • 범주형 변수 1개
  • 관찰 빈도가 기대 빈도와 일치하는지 검정

Fisher 정확검정 — 사용 시기:

  • 2×2 분할표
  • 하나 이상의 기대 셀 빈도가 5 미만
  • 점근적 근사 대신 정확한 p값 제공

McNemar 검정 — 사용 시기:

  • 대응 범주형 데이터 (같은 참가자를 이분형 변수에서 두 번 측정)
  • 예: 사전-사후에서 합격한 학생 비율이 변했는지 검정

고급 설계

반복측정 및 참가자 내 설계

참가자 내 설계는 같은 참가자를 여러 조건에서 측정합니다. 개인차가 변동성의 원천에서 제거되므로 집단 간 설계보다 더 강력합니다.

주요 고려사항:

  • 순서 효과: 체계적 편향을 방지하기 위해 조건 순서를 역균형화
  • 구형성 가정: 반복측정 ANOVA는 구형성(모든 조건 쌍 간 차이의 분산이 동일)을 가정. 위반 시 1종 오류율이 증가. Mauchly 검정으로 확인하고, 위반 시 Greenhouse-Geisser 또는 Huynh-Feldt 보정 적용
  • 이월 효과: 한 조건의 경험이 후속 조건에 대한 반응을 변화시키면 참가자 내 설계가 부적절할 수 있음

혼합 설계

혼합 설계는 집단 간 요인과 집단 내 요인을 결합합니다. 흔한 예로 두 치료 집단의 사전-사후 설계가 있습니다: 치료/통제 요인은 집단 간, 시간 요인은 집단 내. 일반적으로 관심의 핵심은 상호작용 — 시간에 따른 변화가 집단 간에 다른지 여부입니다.

요인 설계

이원 및 고차 ANOVA는 다음을 검정합니다:

  • 주효과: 각 요인이 독립적으로 결과에 영향을 미치는가?
  • 상호작용 효과: 한 요인의 효과가 다른 요인의 수준에 따라 달라지는가?

유의한 상호작용이 있을 때 주효과는 주의해서 해석해야 합니다. 상호작용이 존재하는 상태에서의 유의한 주효과는 다른 요인의 수준에 걸쳐 효과가 반대 방향으로 바뀌면 오해를 유발할 수 있습니다.

표본 크기가 검정 선택에 미치는 영향

표본 크기는 어떤 검정이 적절한지에도 영향을 미칩니다. 일부 검정은 신뢰할 수 있는 결과를 산출하기 위해 최소 표본 크기가 필요합니다:

소표본 (집단당 n < 15):

  • 모수적 대안보다 비모수 검정(Mann-Whitney, Wilcoxon)을 선호
  • 카이제곱 대신 Fisher 정확검정 사용
  • 회귀분석은 주의 — 예측변수당 관찰 수가 적으면 계수 추정이 불안정

중간 표본 (집단당 15-30):

  • 데이터가 심하게 비정규가 아니면 모수적 검정이 일반적으로 허용
  • 가정을 신중하게 확인 — 위반이 가장 큰 영향을 미치는 "회색 지대"
  • Student의 t-검정보다 Welch의 t-검정을 기본값으로 선호

대표본 (집단당 n > 30):

  • 모수적 검정이 대부분의 가정 위반에 견고
  • 공식적 정규성 검정(Shapiro-Wilk)이 과도하게 민감해짐 — Q-Q 플롯을 대신 사용
  • 사소하게 작은 효과도 통계적으로 유의해지므로 효과크기를 신중히 고려

매우 큰 표본 (n > 500):

  • 거의 모든 것이 통계적으로 유의해짐
  • p값만이 아닌 효과크기와 신뢰구간에 집중
  • 실용적 유의성이 통계적 유의성과 일치하는지 고려

가정 검정 워크플로

모수적 검정을 실행하기 전에 데이터가 필요한 가정을 충족하는지 확인하세요. 체계적인 워크플로는 다음과 같습니다:

1단계: 정규성 확인

방법:

  • Shapiro-Wilk 검정: n < 50에서 가장 강력한 정규성 검정. 유의한 결과(p < .05)는 비정규성을 나타냄. 그러나 대표본에서는 사소한 편차도 유의해짐.
  • Q-Q 플롯: 시각적 검사. 점들이 대략적으로 대각선 참조선을 따라야 함. 대표본에서는 공식 검정보다 더 신뢰할 수 있음.
  • 왜도와 첨도: -2에서 +2 사이의 값은 모수적 검정에 일반적으로 허용됨.

결정: 정규성이 위반되고 표본 크기가 작으면(집단당 n < 30) 비모수 대안으로 전환. 표본이 크면 모수적 검정은 중간 정도의 비정규성에 일반적으로 견고.

2단계: 분산의 동질성 확인

방법:

  • Levene 검정: 집단 분산이 동일한지 검정. 유의한 결과는 이질성을 나타냄.
  • 비율 경험 법칙: 가장 큰 집단 분산이 가장 작은 것의 4배 이상이면 이질성 우려.

결정: 분산이 불균등하면 Student의 t-검정 대신 Welch의 t-검정(2집단)이나 Welch의 ANOVA(3개 이상 집단)를 사용. 많은 통계학자들이 이 보정을 기본값으로 권장.

3단계: 독립성 확인

관찰값은 서로 독립적이어야 합니다 — 한 참가자의 반응이 다른 참가자에게 영향을 미쳐서는 안 됩니다. 이 가정은 다음에 의해 위반됩니다:

  • 군집 데이터 (학급의 학생, 병원의 환자)
  • 반복측정 설계 없는 반복 측정
  • 집단 검사 환경에서의 사회적 영향

결정: 독립성이 위반되면 표준 검정 대신 다수준 모형(HLM/MLM)이나 일반화 추정 방정식(GEE)을 사용.

4단계: 적절한 검정 선택

가정 확인 후 데이터를 올바른 검정에 매칭:

가정 충족 → 모수적 검정 소표본에서 정규성 위반 → 비모수 대안 동질성 위반 → Welch 보정 또는 비모수 독립성 위반 → 다수준 모형

검정별 효과크기 지표

올바른 검정을 선택한 후에는 적절한 효과크기도 보고해야 합니다. APA 7판은 모든 추론 검정에 효과크기를 요구합니다. 빠른 참조표:

| 검정 | 효과크기 지표 | 해석 | |------|-------------|------| | 독립표본 t-검정 | Cohen's d | 0.20 작음, 0.50 중간, 0.80 큼 | | 대응표본 t-검정 | Cohen's d_z | d와 동일 기준 | | 일원배치 ANOVA | 부분 η² | .01 작음, .06 중간, .14 큼 | | 이원배치 ANOVA | 부분 η² | 동일 기준 | | Pearson 상관 | r | .10 작음, .30 중간, .50 큼 | | 다중회귀 | , | : .02 작음, .15 중간, .35 큼 | | 로지스틱 회귀 | 승산비 (OR) | OR 1.5 작음, 2.5 중간, 4.3 큼 | | 카이제곱 | Cramer's V | df에 따라 다름; 2×2에서 .10 작음, .30 중간, .50 큼 | | Mann-Whitney U | 순위이연 r | Pearson r 기준과 동일 | | Kruskal-Wallis | 엡실론제곱 (ε²) | η² 기준과 동일 |

핵심 원칙: 항상 검정 결과(검정 통계량과 p값)와 효과크기 및 신뢰구간을 함께 보고하세요. 통계적으로 유의하지만 효과크기가 매우 작은 결과는 효과크기가 큰 결과와 실용적 함의가 다릅니다.

검정 선택에서 흔히 저지르는 실수

데이터 유형에 맞지 않는 검정 사용

가장 근본적인 오류는 한 변수 유형용으로 설계된 검정을 다른 유형에 사용하는 것입니다. 이분형 결과변수에 ANOVA를 실행하거나, 인위적으로 범주화된("중앙값 분할") 연속 데이터에 카이제곱 검정을 사용하면 모두 차선의 결과를 산출합니다. 특히 중앙값 분할은 정보를 폐기하고 검정력을 줄이므로 — 연속 변수에 회귀분석을 사용하세요.

ANOVA 대신 다중 t-검정 실행

4개 집단에서 α = .05로 6번의 쌍별 t-검정을 실시하면 최소 하나의 거짓 양성이 나올 확률이 26.5%입니다. ANOVA는 먼저 총괄(omnibus) 가설을 검정하여 이를 통제합니다. 유의한 ANOVA 결과 후에만 적절한 사후검정 보정으로 쌍별 비교를 진행하세요.

대응 데이터 구조 무시

대응 데이터에 독립표본 검정을 사용하면 참가자 내 상관을 버리게 되어 표준오차가 증가하고 검정력이 감소합니다. 대응표본 t-검정으로 n = 20쌍이면 독립표본 t-검정의 n = 40보다 종종 더 높은 검정력을 보이는데, 개인차가 통제되기 때문입니다.

가정 확인 없이 분석 실행

정규성과 등분산성을 확인하지 않고 모수적 검정을 실행하는 것은 부주의하지만 흔합니다. 최종적으로 검정이 충분히 견고하다고 판단하더라도(적절한 표본 크기에서는 종종 그렇습니다), 가정을 확인했음을 문서화하고 결과를 보고하세요.

보정 없는 다중 검정

동일 데이터셋에서 많은 검정을 실행하면 — 예를 들어 두 집단 간 10개 결과 변수를 비교하면 — 최소 하나의 거짓 양성이 나올 확률은 1 - (1 - 0.05)^10 = 40.1%입니다. Bonferroni 보정(검정 수로 α를 나눔), Holm의 단계적 절차, 또는 Benjamini-Hochberg 거짓 발견률 통제를 적용하세요. 대안으로 다변량 검정(MANOVA)을 총괄 분석으로 사용할 수 있습니다.

상관과 인과 혼동

상관과 회귀는 연관을 정량화하지, 인과 관계를 증명하지 않습니다. 아이스크림 판매량과 익사율 간의 유의한 상관이 아이스크림이 익사를 유발한다는 것을 의미하지는 않습니다 — 둘 다 기온의 영향을 받습니다. 인과적 주장에는 무선 배정과 통제된 조건이 있는 실험 설계가 필요하며, 단순한 통계적 연관이 아닙니다.

실제 예시

예시 1: 심리학자가 치료를 받는 환자와 대기 목록의 환자 간 우울 점수를 비교합니다. 결과변수는 연속형(우울 점수), 두 개의 독립 집단, 충분한 표본 크기. 검정: 독립표본 t-검정. Shapiro-Wilk로 정규성을 확인하고 기본적으로 Welch 보정을 사용.

예시 2: 영양학자가 같은 25명의 참가자에서 식이 변화 전후 혈압을 측정합니다. 결과변수는 연속형, 같은 사람으로부터 두 번의 측정, 중간 크기의 표본. 검정: 대응표본 t-검정 (n = 25에서 정규성이 의심되면 Wilcoxon).

예시 3: 마케팅 연구자가 제품 선호(제품 A, B, C)가 연령 집단(30세 미만, 30-50, 50세 초과)에 따라 다른지 알고 싶습니다. 두 변수 모두 범주형. 검정: 카이제곱 독립성 검정. 기대 셀 빈도가 5 미만이면 Fisher 정확검정을 고려.

예시 4: 교육자가 세 가지 다른 개인 교습법이 시험 점수에 다른 효과를 미치는지 집단당 15명의 학생으로 검증합니다. 결과변수는 연속형, 세 개의 독립 집단. 검정: 일원배치 ANOVA (가정 위반 시 Kruskal-Wallis). 유의하면 Tukey HSD로 후속 분석.

예시 5: 의학 연구자가 나이, BMI, 흡연 상태, 가족력으로 환자의 질병 발생(예/아니오)을 예측하려 합니다. 결과변수는 이분형, 여러 예측변수. 검정: 로지스틱 회귀. 95% 신뢰구간이 포함된 승산비를 보고.

예시 6: 발달 심리학자가 아동의 읽기 능력을 6세, 8세, 10세에 측정합니다. 같은 아동이 각 연령에서 검사됨. 결과변수는 연속형, 같은 참가자로부터 세 시점. 검정: 반복측정 ANOVA (정규성 위반 시 Friedman). Mauchly 검정으로 구형성을 확인하고 필요시 보정 적용.

빠른 참조 플로우차트

다음 경로를 따라 적합한 검정을 찾으세요:

종속변수의 유형은?

범주형인 경우:

  • 변수 1개, 분포 검정 → 카이제곱 적합도 검정
  • 범주형 변수 2개, 독립 데이터 → 카이제곱 독립성 검정 (또는 Fisher 정확검정)
  • 범주형 변수 2개, 대응 데이터 → McNemar 검정
  • 이분형 결과변수 + 예측변수 → 로지스틱 회귀

연속형인 경우:

  • 집단을 비교하는가, 관계를 분석하는가?

    집단 비교:

    • 1집단 vs 기준값 → 단일표본 t-검정 (또는 Wilcoxon 부호순위)
    • 2집단:
      • 독립 → 독립표본 t-검정 (또는 Mann-Whitney U)
      • 대응 → 대응표본 t-검정 (또는 Wilcoxon 부호순위)
    • 3+집단:
      • 독립, 독립변수 1개 → 일원배치 ANOVA (또는 Kruskal-Wallis)
      • 독립, 독립변수 2+개 → 이원배치 ANOVA
      • 대응/반복 → 반복측정 ANOVA (또는 Friedman)
      • 혼합 (둘 다) → 혼합 ANOVA

    관계 분석:

    • 연속 변수 2개 → Pearson 상관 (또는 Spearman)
    • 1개의 X로 Y 예측 → 단순회귀
    • 여러 X로 Y 예측 → 다중회귀

자주 묻는 질문

데이터가 완벽하게 정규분포가 아니어도 모수적 검정을 사용할 수 있나요?

네, 대부분의 경우 가능합니다. 모수적 검정(t-검정, ANOVA)은 중간 정도의 정규성 위반에 견고하며, 특히 표본 크기가 동일하고 적절히 큰 경우(집단당 n > 30)에 그렇습니다. 중심극한정리에 의해 평균의 표본분포는 모집단 분포와 관계없이 정규분포에 접근합니다. 표본이 작고 분포가 심하게 비대칭이거나 극단적 이상치가 있을 때만 비모수 대안으로 전환하세요.

단측 검정과 양측 검정의 차이는 무엇이며, 언제 각각을 사용해야 하나요?

양측 검정은 양방향의 효과를 확인합니다(집단 A가 집단 B보다 높거나 낮을 수 있음). 단측 검정은 한 방향의 효과만 확인합니다. 기본적으로 양측 검정을 사용하세요 — 대부분의 분야에서 표준입니다. 효과의 방향을 예측할 강력한 이론적 근거가 있고, 반대 방향의 효과에 진정으로 관심이 없거나 보고하지 않을 경우에만 단측 검정을 사용하세요. 단측 검정은 검정력이 높지만 심사자의 엄격한 검토를 받습니다.

여러 ANOVA 대신 MANOVA를 언제 사용해야 하나요?

상관된 여러 종속변수가 있고 집단이 결과의 조합에서 차이가 있는지 검정하려면 MANOVA(다변량 분산분석)를 사용하세요. 각 종속변수에 대해 별도의 ANOVA를 실행하면 1종 오류율이 증가합니다. MANOVA는 모든 종속변수를 동시에 검정하여 이를 통제합니다. 그러나 MANOVA는 추가적인 가정(다변량 정규성, 공분산 행렬의 동질성)이 있고 해석이 더 어렵습니다. 종속변수가 상관이 없거나 주요 결과가 하나라면 Bonferroni 보정이 있는 별도의 ANOVA가 더 적절할 수 있습니다.

카이제곱 검정과 Fisher 정확검정 중 어떻게 선택하나요?

기대 셀 빈도가 Cochran 가이드라인을 충족할 때 카이제곱을 사용합니다: 기대빈도가 5 미만인 셀이 전체의 20%를 넘지 않아야 하고, 기대빈도가 1 미만인 셀이 없어야 합니다. 이 조건이 충족되지 않으면 Fisher 정확검정을 사용하세요. 2×2 표의 경우 많은 통계학자들이 항상 Fisher 정확검정을 권장하는데, 카이제곱 근사에 의존하지 않고 정확한 p값을 제공하기 때문입니다. 더 큰 표(3×3 이상)에서는 기대빈도가 적절하면 카이제곱, 부적절하면 Fisher 검정의 Freeman-Halton 확장을 사용하세요.

순서형 데이터(예: 리커트 척도)에는 어떤 검정을 사용해야 하나요?

이것은 논쟁이 있는 주제입니다. 엄밀히 말하면 순서형 데이터는 모수적 검정의 등간 수준 측정 가정을 위반합니다. 비모수 검정(Mann-Whitney, Kruskal-Wallis, Spearman)이 이론적으로 올바른 선택입니다. 그러나 광범위한 시뮬레이션 연구에 따르면 5점 이상의 리커트 척도에서 표본 크기가 적절하고 분포가 심하게 비대칭이 아니면 t-검정과 ANOVA가 잘 작동합니다. 실무에서 대부분의 연구자들은 5점 또는 7점 리커트 척도를 근사적으로 등간으로 취급하고 모수적 검정을 사용하며, 견고성 확인으로 비모수 결과를 보고합니다.

ANOVA 대신 회귀분석을 사용할 수 있나요?

네. ANOVA와 회귀분석은 수학적으로 동등합니다 — ANOVA는 범주형 예측변수를 더미 변수로 코딩한 회귀의 특수한 경우입니다. 회귀분석이 더 유연한데, 연속형과 범주형 예측변수를 동시에 처리하고, 상호작용을 검정하며, 불균등한 집단 크기를 자연스럽게 수용할 수 있기 때문입니다. 많은 통계학자들이 회귀분석을 기본 프레임워크로, ANOVA를 편리한 특수 경우로 사용할 것을 권장합니다.

연구에 집단 간 요인과 집단 내 요인이 모두 있으면 어떻게 하나요?

혼합 ANOVA(분할구획 ANOVA라고도 함)를 사용하세요. 이 설계에는 최소 하나의 집단 간 요인(서로 다른 참가자 집단)과 하나의 집단 내 요인(반복 측정)이 있습니다. 핵심 장점은 집단 간 요인과 집단 내 요인 간의 상호작용을 검정할 수 있다는 것입니다. 예를 들어, 시간에 따른 변화가 치료집단과 통제집단 간에 다른지 검정할 수 있습니다.

반복측정 ANOVA에서 구형성 위반은 어떻게 처리하나요?

구형성은 모든 조건 쌍 간 차이의 분산이 동일함을 의미합니다. Mauchly 검정으로 확인합니다. Mauchly 검정이 유의하면(구형성 위반) 보정을 적용합니다: 엡실론 추정값이 0.75 미만이면 Greenhouse-Geisser를, 0.75 이상이면 Huynh-Feldt를 사용합니다. 이 보정은 자유도를 하향 조정하여 F 검정을 더 보수적으로 만듭니다. 대안으로 구형성을 가정하지 않는 다변량 검정(Pillai's trace, Wilks' lambda)을 사용할 수 있습니다.

StatMate의 검정 선택 도우미 활용하기

어떤 검정을 사용해야 할지 여전히 헷갈린다면, StatMate의 통계 검정 선택 도우미를 활용해 보세요. 변수 유형과 연구 설계에 대한 몇 가지 질문에 답하면 StatMate가 적절한 검정을 추천하고, 가정을 확인하며, APA 형식의 결과를 출력합니다.

StatMate는 t-검정, ANOVA, 상관분석, 회귀분석, 카이제곱, 모든 주요 비모수 대안을 포함하는 20개의 통계 계산기를 지원합니다. 각 계산기에는 내장 가정 확인, 효과크기 계산, 원클릭 APA 형식 지정이 포함되어 있습니다.

통계 검정 선택은 겁먹을 필요가 없습니다. 변수 유형, 집단 수, 표본 관계, 가정이라는 의사결정 로직을 이해하면, 어떤 데이터셋에도 적용할 수 있는 반복 가능한 프로세스가 됩니다.

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.