반복측정 분산분석이란?
반복측정 분산분석(Repeated Measures ANOVA)은 동일한 참가자를 여러 조건이나 시점에서 반복 측정한 데이터를 분석하는 통계 방법입니다. 일반적인 일원배치 분산분석(One-way ANOVA)이 서로 다른 집단 간 차이를 비교하는 반면, 반복측정 분산분석은 같은 사람을 여러 번 측정했을 때 조건 간에 유의한 차이가 있는지를 검증합니다.
이 설계를 **피험자 내 설계(Within-subjects design)**라고도 부르며, 개인차 변동을 통제할 수 있어 독립표본 설계보다 통계적 검정력이 높다는 장점이 있습니다.
언제 반복측정 분산분석을 사용하나요?
반복측정 분산분석은 다음과 같은 연구 상황에서 사용합니다.
- 시계열 비교: 같은 환자를 치료 전, 치료 중, 치료 후에 측정하여 시점 간 차이를 확인
- 조건 비교: 같은 참가자가 세 가지 이상의 약물을 복용한 후 반응 시간을 비교
- 학습 효과: 같은 학생의 1차, 2차, 3차 시험 점수를 비교하여 학습 향상 여부를 확인
- 감각 실험: 같은 평가자가 여러 제품을 평가한 점수를 비교
핵심 조건은 동일한 대상이 3개 이상의 조건(또는 시점)에서 측정되었다는 것입니다. 만약 2개 조건만 비교한다면 대응표본 t-검정이 더 적합합니다.
반복측정 분산분석의 가정
분석을 실행하기 전에 다음 가정이 충족되는지 확인해야 합니다. 가정 위반 시 결과의 신뢰성이 떨어질 수 있습니다.
1. 종속변수가 연속형이어야 합니다
측정값은 등간 척도(interval) 또는 비율 척도(ratio)여야 합니다. 예를 들어, 시험 점수, 반응 시간(ms), 체중(kg) 등이 해당됩니다. 서열 척도(예: 리커트 5점) 데이터는 Friedman 검정이 더 적합합니다.
2. 정규성
각 조건(시점)에서의 종속변수 분포가 대략적으로 정규분포를 따라야 합니다. Shapiro-Wilk 검정으로 확인하며, 표본 크기가 30 이상이면 중심극한정리에 의해 다소 완화됩니다.
3. 구형성 (Sphericity)
반복측정 분산분석에서 가장 중요한 고유 가정입니다. 구형성이란 모든 조건 쌍 간 차이 점수의 분산이 동일해야 한다는 것을 의미합니다.
예를 들어, 세 시점(T1, T2, T3)이 있다면:
- T1-T2 차이의 분산
- T1-T3 차이의 분산
- T2-T3 차이의 분산
이 세 분산이 대략적으로 같아야 합니다.
구형성은 Mauchly의 구형성 검정으로 확인합니다.
| Mauchly 검정 결과 | 해석 | 대응 방법 | |---|---|---| | p > .05 | 구형성 가정 충족 | 일반적인 F 검정 결과 사용 | | p < .05 | 구형성 가정 위반 | Greenhouse-Geisser 또는 Huynh-Feldt 보정 적용 |
예제 데이터: 인지행동치료 효과 연구
12명의 불안장애 환자를 대상으로 인지행동치료(CBT) 효과를 평가합니다. 치료 전, 치료 4주 후, 치료 8주 후에 불안 점수(BAI, 0~63점)를 측정했습니다.
| 참가자 | 치료 전 (T1) | 4주 후 (T2) | 8주 후 (T3) | |--------|-------------|-------------|-------------| | 1 | 42 | 35 | 28 | | 2 | 38 | 30 | 22 | | 3 | 45 | 38 | 30 | | 4 | 36 | 32 | 25 | | 5 | 40 | 33 | 27 | | 6 | 50 | 42 | 35 | | 7 | 34 | 28 | 20 | | 8 | 47 | 40 | 32 | | 9 | 39 | 31 | 24 | | 10 | 43 | 36 | 29 | | 11 | 41 | 34 | 26 | | 12 | 37 | 29 | 21 |
기술통계량
| 시점 | 평균 (M) | 표준편차 (SD) | |------|----------|--------------| | 치료 전 (T1) | 41.00 | 4.55 | | 4주 후 (T2) | 34.00 | 4.31 | | 8주 후 (T3) | 26.58 | 4.48 |
치료 전 평균이 41.00이었던 불안 점수가 4주 후 34.00, 8주 후 26.58로 감소하는 추세를 보입니다. 이 차이가 통계적으로 유의한지 반복측정 분산분석으로 검증합니다.
1단계: 가정 검증
정규성 검정 (Shapiro-Wilk)
| 시점 | W 통계량 | p 값 | 판정 | |------|---------|------|------| | T1 | 0.962 | .812 | 정규성 충족 | | T2 | 0.958 | .764 | 정규성 충족 | | T3 | 0.970 | .905 | 정규성 충족 |
세 시점 모두 Shapiro-Wilk 검정의 p 값이 .05보다 크므로 정규성 가정이 충족됩니다.
구형성 검정 (Mauchly)
| Mauchly의 W | 카이제곱 | 자유도 | p 값 | |-------------|---------|--------|------| | 0.874 | 1.348 | 2 | .510 |
Mauchly 검정의 p = .510 > .05이므로 구형성 가정이 충족됩니다. 따라서 보정 없이 일반적인 F 검정 결과를 사용할 수 있습니다.
만약 구형성이 위반되었다면 다음과 같이 보정합니다.
| 상황 | 보정 방법 | 설명 | |------|----------|------| | epsilon < .75 | Greenhouse-Geisser | 보수적 보정, 구형성 위반이 심할 때 | | epsilon >= .75 | Huynh-Feldt | 덜 보수적인 보정, 위반이 경미할 때 |
epsilon 값은 Greenhouse-Geisser epsilon으로, 1에 가까울수록 구형성에 가까우며 1/(k-1)에 가까울수록 심한 위반을 나타냅니다(k = 조건 수).
2단계: 반복측정 분산분석 실행
StatMate 반복측정 분산분석 계산기에 데이터를 입력합니다.
피험자 내 효과 검정 결과
| 변동원 | 제곱합 (SS) | 자유도 (df) | 평균제곱 (MS) | F | p 값 | |--------|-----------|------------|-------------|------|------| | 시점 | 1257.72 | 2 | 628.86 | 259.55 | < .001 | | 오차 | 53.28 | 22 | 2.42 | | |
F(2, 22) = 259.55, p < .001로 세 시점 간 불안 점수에 통계적으로 유의한 차이가 있습니다.
효과크기
| 효과크기 | 값 | 해석 | |---------|-----|------| | 편 에타제곱 (partial eta-squared) | .959 | 매우 큰 효과 |
편 에타제곱의 해석 기준은 다음과 같습니다.
| 편 에타제곱 | 효과 크기 | |------------|----------| | .01 | 작은 효과 | | .06 | 중간 효과 | | .14 이상 | 큰 효과 |
본 연구의 편 에타제곱 .959는 시점이 불안 점수 변동의 약 96%를 설명한다는 것을 의미하며, 이는 매우 큰 효과입니다.
3단계: 사후비교 (Post-hoc Tests)
반복측정 분산분석에서 유의한 결과가 나왔다면, 어느 시점 간에 차이가 있는지 사후비교를 통해 확인해야 합니다. Bonferroni 보정을 적용한 대응비교 결과는 다음과 같습니다.
| 비교 쌍 | 평균차 | 표준오차 | p 값 (Bonferroni 보정) | 유의 여부 | |---------|--------|---------|----------------------|----------| | T1 vs T2 | 7.00 | 0.60 | < .001 | 유의함 | | T1 vs T3 | 14.42 | 0.73 | < .001 | 유의함 | | T2 vs T3 | 7.42 | 0.58 | < .001 | 유의함 |
세 쌍의 비교 모두에서 유의한 차이가 확인되었습니다. 치료 전(T1)에서 4주 후(T2)로, 4주 후(T2)에서 8주 후(T3)로 각각 불안 점수가 유의하게 감소했습니다.
4단계: 결과 해석 방법
APA 형식 보고
반복측정 분산분석 결과, 치료 시점에 따라 불안 점수에 유의한 차이가 있었다, F(2, 22) = 259.55, p < .001, partial eta-squared = .959. Bonferroni 사후비교 결과, 치료 전(M = 41.00, SD = 4.55)에서 4주 후(M = 34.00, SD = 4.31), 4주 후에서 8주 후(M = 26.58, SD = 4.48)로 모두 유의한 감소가 나타났다(모든 p < .001).
구형성 위반 시 APA 보고 방식
만약 구형성 가정이 위반되어 Greenhouse-Geisser 보정을 적용했다면, 보정된 자유도를 보고합니다.
반복측정 분산분석 결과, Mauchly 검정에서 구형성 가정이 위반되었으므로(W = 0.65, p = .032), Greenhouse-Geisser 보정을 적용하였다(epsilon = .74). 보정된 결과, 시점에 따른 차이가 유의하였다, F(1.48, 16.28) = 259.55, p < .001, partial eta-squared = .959.
결과 해석의 핵심 포인트
- F 값과 p 값: F(2, 22) = 259.55, p < .001은 세 시점 중 적어도 하나의 쌍에서 유의한 차이가 있음을 의미합니다.
- 효과크기: 편 에타제곱 .959는 시점 변인이 불안 점수의 거의 모든 변동을 설명한다는 것을 의미합니다.
- 사후비교: 세 쌍 모두 유의하므로, 치료 과정 전반에 걸쳐 불안이 지속적으로 감소했습니다.
- 실질적 의미: 치료 전 평균 41.00에서 8주 후 26.58로, BAI 점수 기준으로 "중등도 불안"에서 "경미한 불안" 수준으로 개선되었습니다.
구형성 위반 시 대처 방안 상세
구형성은 반복측정 분산분석에서 가장 자주 위반되는 가정입니다. 위반 시 1종 오류(거짓 양성)가 증가합니다.
방법 1: Epsilon 보정
| 보정 방법 | 특징 | 권장 상황 | |----------|------|----------| | Greenhouse-Geisser | 보수적, 자유도를 줄여 p값 증가 | epsilon < .75일 때 | | Huynh-Feldt | 덜 보수적, GG보다 약간 더 큰 자유도 | epsilon >= .75일 때 | | Lower-bound | 가장 보수적 (df = 1) | 극심한 위반 시 |
방법 2: 다변량 접근 (MANOVA)
구형성 가정이 필요 없는 다변량 분산분석(MANOVA)을 사용할 수 있습니다. 다만 표본 크기가 충분히 커야 안정적인 결과를 얻습니다.
방법 3: 혼합효과모형 (Mixed-effects Model)
결측치가 있거나 구형성이 심하게 위반된 경우, 혼합효과모형이 더 유연한 대안입니다.
연구 설계 시 고려사항
표본 크기
반복측정 분산분석에서 필요한 표본 크기는 조건 수, 예상 효과크기, 조건 간 상관에 따라 달라집니다.
| 효과크기 | 조건 수 3개 | 조건 수 4개 | 조건 수 5개 | |---------|-----------|-----------|-----------| | 작은 (f = .10) | 약 96명 | 약 82명 | 약 73명 | | 중간 (f = .25) | 약 18명 | 약 15명 | 약 14명 | | 큰 (f = .40) | 약 9명 | 약 8명 | 약 7명 |
위 값은 검정력 .80, 유의수준 .05, 조건 간 상관 .50 기준입니다.
순서 효과 통제
반복측정 설계에서는 **이월 효과(carryover effect)**와 **순서 효과(order effect)**를 주의해야 합니다.
- 역균형화(Counterbalancing): 참가자마다 조건 순서를 무작위로 배정
- 워시아웃 기간(Washout period): 조건 사이에 충분한 간격 배치
- 라틴 사각형(Latin Square): 체계적으로 순서를 통제
시간에 따른 변화를 측정하는 경우(예: 치료 전-중-후)에는 순서를 바꿀 수 없으므로 이 점을 결과 해석에 반영해야 합니다.
반복측정 분산분석 vs 다른 분석 방법
| 상황 | 적합한 분석 | |------|-----------| | 동일 대상, 2개 조건 | 대응표본 t-검정 | | 동일 대상, 3개 이상 조건, 정규성 충족 | 반복측정 분산분석 | | 동일 대상, 3개 이상 조건, 정규성 위반 | Friedman 검정 | | 서로 다른 집단, 3개 이상 | 일원배치 ANOVA | | 피험자 간 + 피험자 내 혼합 | 혼합 ANOVA (Mixed ANOVA) |
자주 묻는 질문 (FAQ)
Q1: 반복측정 분산분석은 최소 몇 개의 조건이 필요한가요?
최소 3개의 조건(시점)이 필요합니다. 2개 조건만 있다면 대응표본 t-검정을 사용하세요. 수학적으로는 반복측정 ANOVA를 2개 조건에 적용할 수 있지만, 대응표본 t-검정과 동일한 결과를 산출합니다.
Q2: 결측치가 있으면 어떻게 하나요?
반복측정 분산분석은 기본적으로 **완전한 데이터(listwise deletion)**만 사용합니다. 결측치가 있는 참가자는 전체 분석에서 제외됩니다. 결측이 많다면 혼합효과모형을 고려하세요.
Q3: 구형성 검정의 p 값이 정확히 .05이면 어떻게 하나요?
경계선 사례에서는 보수적으로 Greenhouse-Geisser 보정을 적용하는 것이 안전합니다. 또는 일반 결과와 보정 결과를 모두 보고하고, 결론이 동일한지 확인하는 방법도 있습니다.
Q4: 사후비교에서 Bonferroni 외에 다른 방법을 사용할 수 있나요?
네. Sidak 보정, Holm 보정 등 다양한 다중비교 보정 방법이 있습니다. Bonferroni는 가장 보수적이며 널리 사용되는 방법입니다. 조건 수가 많을 때는 Holm 보정이 검정력 손실을 줄여주는 대안이 될 수 있습니다.
Q5: 반복측정 분산분석에서 유의하지 않으면 어떻게 해석하나요?
F 검정이 유의하지 않다면(p > .05), 시점(조건) 간에 통계적으로 유의한 차이가 없다고 결론짓습니다. 이때 효과크기도 함께 보고하여 실질적 의미를 평가해야 합니다. 효과크기가 작고 p 값이 크다면 진정으로 차이가 없을 가능성이 높지만, 효과크기가 중간이면서 p 값이 .05에 근접하다면 표본 크기 부족(검정력 부족)일 수 있습니다.
Q6: 피험자 간 변인과 피험자 내 변인이 동시에 있으면 어떻게 하나요?
이 경우 **혼합 분산분석(Mixed ANOVA)**을 사용합니다. 예를 들어, 실험집단과 통제집단(피험자 간)을 세 시점(피험자 내)에서 비교하는 설계입니다. 혼합 ANOVA는 집단 간 주효과, 시점 주효과, 그리고 상호작용 효과를 동시에 검정할 수 있습니다.
직접 해보기
StatMate의 반복측정 분산분석 계산기를 사용하면 데이터를 입력하는 것만으로 구형성 검정, F 검정, 효과크기, 사후비교를 모두 자동으로 수행할 수 있습니다. APA 형식 결과와 시각화 차트도 즉시 확인할 수 있으므로, 위에서 배운 내용을 직접 실습해보세요.