본문으로 건너뛰기
S
StatMate
블로그 목록
사용 가이드16 min read2026-02-19

분산분석(ANOVA) 실행 방법 — 단계별 가이드

일원분산분석(One-Way ANOVA)을 처음부터 끝까지 수행하는 방법을 알아봅니다. 가정 검증, F-통계량 계산, 사후 검정까지 실제 예제와 함께 단계별로 설명합니다.

소개

분산분석(Analysis of Variance, ANOVA)은 세 개 이상의 집단 평균이 통계적으로 유의한 차이를 보이는지 검정하는 통계 기법입니다. 두 집단을 비교할 때는 t-검정을 사용하지만, 비교 대상이 셋 이상이면 t-검정을 반복하면 제1종 오류(거짓 양성)가 급격히 증가합니다. ANOVA는 이 문제를 해결하기 위해 전체 분산을 집단 간 분산과 집단 내 분산으로 분해하여 한 번의 검정으로 집단 차이를 평가합니다.

일원분산분석(One-Way ANOVA)은 가장 기본적인 형태의 ANOVA로, 하나의 독립변수(요인)가 하나의 연속형 종속변수에 미치는 영향을 분석합니다. 예를 들어, 세 가지 교수법(강의식, 토론식, 실습식)이 학생들의 시험 점수에 차이를 만드는지 검정하는 상황이 대표적입니다.

이 가이드에서는 일원분산분석을 실행하기 위한 모든 단계를 실제 데이터 예제와 함께 상세히 안내합니다. StatMate의 ANOVA 계산기를 활용하면 데이터를 입력하는 것만으로 F-통계량, p-값, 효과 크기, 사후 검정 결과를 자동으로 얻을 수 있습니다.

일원분산분석을 사용해야 하는 상황

일원분산분석은 다음 조건을 모두 만족할 때 적합합니다.

  • 독립변수: 범주형 변수 1개 (3개 이상의 수준/집단)
  • 종속변수: 연속형 변수 1개 (등간 또는 비율 척도)
  • 독립 표본: 각 관측치가 하나의 집단에만 속함

만약 독립변수가 2개라면 이원분산분석(Two-Way ANOVA)을, 동일한 참가자를 반복 측정했다면 반복측정 분산분석(Repeated Measures ANOVA)을 사용해야 합니다.

1단계: 연구 가설 설정

ANOVA에서의 가설은 다음과 같습니다.

  • 귀무가설(H₀): 모든 집단의 모평균이 동일하다. (μ₁ = μ₂ = μ₃ = ... = μₖ)
  • 대립가설(H₁): 적어도 하나의 집단 모평균이 다르다.

주의할 점은 대립가설이 "모든 집단이 서로 다르다"를 의미하지 않는다는 것입니다. 단 하나의 집단이라도 다른 집단과 차이가 있으면 귀무가설을 기각합니다.

2단계: 가정 검증

일원분산분석의 결과가 타당하려면 다음 세 가지 가정이 충족되어야 합니다.

가정 1: 정규성

각 집단의 종속변수 분포가 정규분포를 따라야 합니다. 검증 방법은 다음과 같습니다.

| 검증 방법 | 설명 | 판단 기준 | |-----------|------|-----------| | Shapiro-Wilk 검정 | 소표본(N < 50)에 적합 | p > .05이면 정규성 가정 | | Q-Q 도표 | 시각적 확인 | 점들이 대각선에 가까우면 정상 | | 왜도/첨도 | 분포 형태 확인 | 왜도 절댓값 < 2, 첨도 절댓값 < 7 |

ANOVA는 표본 크기가 각 집단 30명 이상이면 중심극한정리에 의해 정규성 위반에 비교적 강건합니다.

가정 2: 등분산성

각 집단의 분산이 동일해야 합니다. Levene 검정으로 확인합니다.

| Levene 검정 결과 | 해석 | 대처 방안 | |-----------------|------|-----------| | p > .05 | 등분산 가정 충족 | 일반 ANOVA 진행 | | p ≤ .05 | 등분산 가정 위반 | Welch ANOVA 사용 |

등분산이 위반되면 Welch의 F-검정을 사용합니다. 이는 분산이 다른 상황에서도 강건한 대안입니다.

가정 3: 독립성

각 관측치가 서로 독립적이어야 합니다. 이 가정은 통계적 검정이 아니라 연구 설계로 확인합니다. 무선 배정, 독립적 측정 등 연구 방법이 적절했는지 확인하세요.

3단계: 예제 데이터 준비

세 가지 비료(A, B, C)가 식물의 성장 높이(cm)에 미치는 영향을 비교하는 실험을 예로 들겠습니다.

비료 A (집단 1)

| 관측치 | 성장 높이(cm) | |--------|--------------| | 1 | 20.5 | | 2 | 22.3 | | 3 | 19.8 | | 4 | 21.1 | | 5 | 23.0 | | 6 | 20.7 | | 7 | 22.5 | | 8 | 21.4 |

비료 B (집단 2)

| 관측치 | 성장 높이(cm) | |--------|--------------| | 1 | 25.2 | | 2 | 26.8 | | 3 | 24.5 | | 4 | 27.1 | | 5 | 25.9 | | 6 | 26.3 | | 7 | 24.8 | | 8 | 25.7 |

비료 C (집단 3)

| 관측치 | 성장 높이(cm) | |--------|--------------| | 1 | 28.4 | | 2 | 30.2 | | 3 | 29.1 | | 4 | 27.8 | | 5 | 31.0 | | 6 | 29.5 | | 7 | 28.9 | | 8 | 30.3 |

기술통계량 요약

| 집단 | N | 평균 | 표준편차 | |------|---|------|---------| | 비료 A | 8 | 21.41 | 1.10 | | 비료 B | 8 | 25.79 | 0.88 | | 비료 C | 8 | 29.40 | 1.03 |

4단계: ANOVA 계산 과정

전체 평균 (Grand Mean)

전체 평균 = (21.41 + 25.79 + 29.40) / 3 = 25.53

집단 간 제곱합 (SSB: Sum of Squares Between)

SSB = Σnⱼ(X̄ⱼ - X̄)²

  • 비료 A: 8 × (21.41 − 25.53)² = 8 × 16.97 = 135.78
  • 비료 B: 8 × (25.79 − 25.53)² = 8 × 0.07 = 0.54
  • 비료 C: 8 × (29.40 − 25.53)² = 8 × 14.98 = 119.84

SSB = 135.78 + 0.54 + 119.84 = 256.16

집단 내 제곱합 (SSW: Sum of Squares Within)

SSW = ΣΣ(Xᵢⱼ - X̄ⱼ)²

각 집단의 편차 제곱합을 합산합니다.

  • 비료 A: (n₁ − 1) × s₁² = 7 × 1.21 = 8.47
  • 비료 B: (n₂ − 1) × s₂² = 7 × 0.77 = 5.42
  • 비료 C: (n₃ − 1) × s₃² = 7 × 1.06 = 7.44

SSW = 8.47 + 5.42 + 7.44 = 21.33

자유도

| 변동원 | 자유도 공식 | 계산 | |--------|-----------|------| | 집단 간 (dfB) | k − 1 | 3 − 1 = 2 | | 집단 내 (dfW) | N − k | 24 − 3 = 21 | | 전체 (dfT) | N − 1 | 24 − 1 = 23 |

평균 제곱 (Mean Square)

  • MSB = SSB / dfB = 256.16 / 2 = 128.08
  • MSW = SSW / dfW = 21.33 / 21 = 1.02

F-통계량

F = MSB / MSW = 128.08 / 1.02 = 125.57

ANOVA 분산분석표

| 변동원 | SS | df | MS | F | p | |--------|-------|----|----|--------|-------| | 집단 간 | 256.16 | 2 | 128.08 | 125.57 | < .001 | | 집단 내 | 21.33 | 21 | 1.02 | | | | 전체 | 277.49 | 23 | | | |

5단계: 효과 크기 계산

통계적 유의성만으로는 실질적 의미를 알 수 없습니다. 효과 크기를 함께 보고해야 합니다.

에타 제곱 (η²)

η² = SSB / SST = 256.16 / 277.49 = 0.923

이는 종속변수 총 분산의 92.3%가 비료 종류에 의해 설명된다는 의미입니다.

효과 크기 해석 기준

| η² 값 | 효과 크기 | |--------|----------| | .01 | 작은 효과 | | .06 | 중간 효과 | | .14 이상 | 큰 효과 |

η² = .923은 매우 큰 효과에 해당합니다.

6단계: 사후 검정 (Post-hoc Test)

ANOVA에서 유의한 결과(p < .05)가 나왔다면, 이는 "적어도 하나의 집단이 다르다"는 의미일 뿐 어느 집단 쌍이 다른지는 알 수 없습니다. 사후 검정(Post-hoc test)을 통해 구체적인 쌍별 차이를 확인합니다.

Bonferroni 사후 검정 결과

| 비교 쌍 | 평균 차이 | p (보정) | 유의 여부 | |---------|----------|---------|----------| | 비료 A vs 비료 B | −4.38 | < .001 | 유의 | | 비료 A vs 비료 C | −7.99 | < .001 | 유의 | | 비료 B vs 비료 C | −3.61 | < .001 | 유의 |

세 집단 모두 서로 유의한 차이를 보였습니다. 비료 C가 가장 높은 성장을 보였고, 비료 A가 가장 낮은 성장을 보였습니다.

주요 사후 검정 방법 비교

| 방법 | 특징 | 사용 시점 | |------|------|----------| | Bonferroni | 가장 보수적; α를 비교 수로 나눔 | 비교 쌍이 적을 때 | | Tukey HSD | 모든 쌍별 비교에 최적화 | 모든 집단 쌍을 비교할 때 | | Scheffe | 가장 보수적; 복잡한 대비 가능 | 사전 계획된 대비가 있을 때 | | Games-Howell | 등분산 가정 불필요 | 등분산성 위반 시 |

결과 해석 방법

APA 형식 보고

ANOVA 결과는 APA 형식으로 다음과 같이 보고합니다.

일원분산분석 결과, 비료 종류에 따라 식물의 성장 높이에 통계적으로 유의한 차이가 있었다, F(2, 21) = 125.57, p < .001, η² = .923. Bonferroni 사후 검정 결과, 비료 C(M = 29.40, SD = 1.03)가 비료 B(M = 25.79, SD = 0.88)와 비료 A(M = 21.41, SD = 1.10)보다 유의하게 높았으며, 비료 B도 비료 A보다 유의하게 높았다(모든 p < .001).

결과 해석의 핵심 요소

  1. F-통계량과 자유도: F(2, 21) = 125.57 — 집단 간 분산이 집단 내 분산의 약 126배
  2. p-값: p < .001 — 집단 간 차이가 우연에 의한 것이 아님
  3. 효과 크기: η² = .923 — 비료 종류가 성장의 92.3%를 설명하는 매우 큰 효과
  4. 사후 검정: 구체적으로 어떤 집단 쌍이 다른지 확인

비유의적 결과(p > .05)인 경우

만약 F-검정이 유의하지 않다면 다음과 같이 보고합니다.

일원분산분석 결과, 집단 간 유의한 차이가 관찰되지 않았다, F(2, 21) = 1.85, p = .183, η² = .15. 이 결과는 처리 조건에 따른 평균 차이가 통계적으로 유의하지 않음을 시사한다.

비유의적 결과에서는 사후 검정을 실시하지 않습니다.

StatMate로 ANOVA 실행하기

StatMate의 ANOVA 계산기를 사용하면 위의 모든 단계를 자동으로 수행할 수 있습니다.

  1. ANOVA 계산기 페이지에 접속합니다.
  2. 집단 수를 설정합니다 (이 예제에서는 3개).
  3. 각 집단 이름과 데이터를 입력합니다. 값은 쉼표나 줄바꿈으로 구분합니다.
  4. 계산 버튼을 클릭합니다.
  5. 결과에서 F-통계량, p-값, 효과 크기, 사후 검정 결과를 확인합니다.
  6. 가정 검증(정규성, 등분산성) 결과도 자동으로 제공됩니다.
  7. APA 형식 결과를 클립보드에 복사하거나 PDF로 내보낼 수 있습니다.

자주 묻는 질문 (FAQ)

ANOVA 대신 t-검정을 여러 번 하면 안 되나요?

안 됩니다. 3개 집단에서 t-검정을 3번 수행하면(A-B, A-C, B-C), 유의수준 α = .05에서 제1종 오류율이 1 − (1 − .05)³ = 14.3%로 증가합니다. 집단 수가 늘어날수록 이 문제는 더 심해집니다. ANOVA는 전체 비교를 한 번에 수행하여 α를 .05로 유지합니다.

집단별 표본 크기가 다르면 어떻게 하나요?

일원분산분석은 비균형 설계(집단 크기가 다른 경우)에서도 수행 가능합니다. 다만 등분산성 가정이 더 중요해지므로, Levene 검정을 반드시 확인하세요. 등분산이 위반되면 Welch ANOVA를 사용합니다.

정규성 가정이 위반되면 어떻게 하나요?

표본 크기가 충분히 크면(각 집단 30명 이상) ANOVA는 정규성 위반에 강건합니다. 하지만 표본이 작고 심한 비정규성이 관찰되면, 비모수 대안인 Kruskal-Wallis H 검정을 고려하세요.

효과 크기는 왜 보고해야 하나요?

p-값은 표본 크기에 민감합니다. 큰 표본에서는 사소한 차이도 유의해질 수 있고, 작은 표본에서는 큰 차이도 유의하지 않을 수 있습니다. 효과 크기(η²)는 표본 크기와 독립적으로 차이의 실질적 크기를 알려줍니다.

사후 검정은 언제 실시하나요?

ANOVA의 F-검정이 유의한 경우에만 사후 검정을 실시합니다. F-검정이 유의하지 않다면 집단 간 차이가 없다는 것이므로 쌍별 비교는 의미가 없습니다.

ANOVA와 회귀분석의 관계는 무엇인가요?

ANOVA는 사실 일반선형모형(General Linear Model)의 특수한 경우입니다. 범주형 독립변수를 더미 코딩하면 회귀분석과 동일한 결과를 산출합니다. 두 방법 모두 F-통계량을 사용하여 모형의 유의성을 검정합니다.

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.