반복측정 ANOVA를 정확하게 보고해야 하는 이유
반복측정 분산분석(Repeated Measures ANOVA)은 동일한 참여자를 세 개 이상의 조건에서 측정할 때 사용하는 표준 통계 기법입니다. 환자의 시간대별 회복 추적, 실험 조건별 수행 비교, 학습 효과의 시간적 변화 분석 등 사회·행동과학 전 분야에서 광범위하게 사용됩니다.
그러나 반복측정 ANOVA의 APA 보고는 일원분산분석보다 복잡합니다. 구형성 가정을 다루고, 필요시 그린하우스-가이서 보정을 적용하며, 피험자 내 효과크기를 보고해야 합니다. 이러한 세부 사항을 정확히 기술하는 것이 논문 심사 통과의 핵심입니다.
이 가이드는 APA 7판에 따른 반복측정 ANOVA 보고의 모든 구성요소를 다룹니다. 기술통계부터 구형성 검정, 사후 비교, 효과크기, 혼합설계, 그리고 흔한 보고 실수까지 포함합니다.
APA 반복측정 ANOVA 보고의 필수 구성요소
APA 7판에서 반복측정 ANOVA 결과를 보고할 때 반드시 포함해야 하는 요소:
- F 통계량 (이탤릭체)
- 자유도: 효과(분자)와 오차(분모), 괄호 안에 표기
- 정확한 p 값 (소수점 셋째 자리까지)
- 효과크기: 부분 에타제곱 (η2p)
- 구형성 검정 결과 (모클리의 W)
- 보정 방법 (구형성 위반 시 그린하우스-가이서 또는 훈-펠트)
기본 템플릿:
F(df_효과, df_오차) = X.XX, p = .XXX, η2p = .XX
1단계: 기술통계 보고
각 조건 또는 시점의 평균과 표준편차를 표 또는 본문으로 제시합니다.
예시 시나리오: 40명의 참여자를 대상으로 기저선, 치료 후, 3개월 추적에서 불안 점수(0-100)를 측정했습니다.
| 시점 | n | M | SD | |------|-----|------|------| | 기저선 | 40 | 62.50 | 12.30 | | 치료 후 | 40 | 48.75 | 11.85 | | 3개월 추적 | 40 | 45.20 | 13.10 |
APA 형식으로 작성:
불안 점수의 평균은 기저선(M = 62.50, SD = 12.30)에서 치료 후(M = 48.75, SD = 11.85)로 감소하였으며, 3개월 추적(M = 45.20, SD = 13.10)에서도 낮은 수준을 유지하였다.
신뢰구간 포함
APA 7판은 평균의 95% 신뢰구간 보고를 권장합니다. 피험자 내 비교가 포함된 설계에서는 Cousineau-Morey 피험자 내 신뢰구간을 사용하는 것이 좋습니다. 이 방법은 피험자 간 변동성을 제거하여 조건 간 의미 있는 시각적 비교를 가능하게 합니다:
기저선(M = 62.50, 95% CI [59.56, 65.44]), 치료 후(M = 48.75, 95% CI [45.92, 51.58]), 3개월 추적(M = 45.20, 95% CI [42.01, 48.39]).
표준적인 피험자 간 신뢰구간은 반복측정 설계에서 오해를 유발할 수 있습니다. 반복측정 설계가 제거하는 개인차가 포함되기 때문입니다.
2단계: 모클리 구형성 검정 보고
구형성(sphericity)은 모든 조건 쌍 간 차이의 분산이 동일하다는 가정입니다. 반복측정 ANOVA는 이 가정을 필요로 하며, 항상 모클리 검정 결과를 보고해야 합니다.
구형성이 충족된 경우:
모클리 검정 결과 구형성 가정이 충족되었다, W = 0.94, p = .312.
구형성이 위반된 경우:
모클리 검정 결과 구형성 가정이 위반되었다, W = 0.72, p = .008. 따라서 그린하우스-가이서 보정을 적용하여 자유도를 조정하였다(ε = 0.78).
어떤 보정을 사용해야 하는가?
- 그린하우스-가이서(Greenhouse-Geisser): ε < 0.75일 때 사용 (보수적, 기본 권장)
- 훈-펠트(Huynh-Feldt): ε ≥ 0.75일 때 사용 (덜 보수적)
대부분의 학술지와 APA 가이드라인은 그린하우스-가이서를 기본 보정으로 권장합니다. 위반의 정도를 보여주기 위해 엡실론 값을 보고합니다.
3단계: ANOVA 결과와 효과크기 보고
구형성이 충족된 경우 (보정 없음)
반복측정 분산분석 결과, 시간이 불안 점수에 미치는 효과가 통계적으로 유의하였다, F(2, 78) = 18.45, p < .001, η2p = .32.
구형성이 위반된 경우 (그린하우스-가이서 보정)
그린하우스-가이서 보정을 적용한 반복측정 분산분석 결과, 시간이 불안 점수에 미치는 효과가 통계적으로 유의하였다, F(1.56, 60.84) = 18.45, p < .001, η2p = .32.
보정된 자유도가 정수가 아닌 것은 정상입니다. 소수점 둘째 자리까지 보고합니다.
부분 에타제곱 이해하기
부분 에타제곱(η2p)은 반복측정 ANOVA의 표준 효과크기입니다. 모형의 다른 변수가 설명하는 분산을 제외한 후, 독립변수가 종속변수 분산의 몇 퍼센트를 설명하는지를 나타냅니다.
해석 기준 (Cohen, 1988):
| η2p | 해석 | |---|---| | .01 | 작은 효과 | | .06 | 중간 효과 | | .14 | 큰 효과 |
예시에서 η2p = .32는 큰 효과에 해당하며, 개인차를 통제한 후 시간이 불안 점수 분산의 약 32%를 설명함을 의미합니다.
부분 에타제곱 vs. 에타제곱
반복측정 설계에서는 반드시 부분 에타제곱을 보고해야 합니다. 일반 에타제곱은 피험자 변동성을 분모에 포함하여 효과를 과소추정할 수 있습니다. SPSS에서는 "Partial Eta Squared"로 표시됩니다.
4단계: 사후 쌍별 비교 보고
전체 ANOVA가 유의하면 쌍별 비교로 어떤 조건 간 차이가 있는지 확인합니다.
본페로니 보정을 적용한 사후 쌍별 비교 결과, 불안 점수는 기저선에서 치료 후로 유의하게 감소하였고(Mdiff = 13.75, SE = 2.41, p < .001, d = 1.14), 기저선에서 3개월 추적으로도 유의하게 감소하였다(Mdiff = 17.30, SE = 2.68, p < .001, d = 1.36). 치료 후와 3개월 추적 간 차이는 통계적으로 유의하지 않았다(Mdiff = 3.55, SE = 2.15, p = .312, d = 0.28).
포함해야 할 요소:
- 평균 차이 (Mdiff)
- 표준오차 (SE)
- 보정된 p 값 (본페로니 보정 적용)
- 각 쌍별 비교의 Cohen's d
완전한 보고 예시
모든 요소를 결합한 전체 결과 섹션:
결과
불안 점수의 평균은 기저선(M = 62.50, SD = 12.30)에서 치료 후(M = 48.75, SD = 11.85)로 감소하였으며, 3개월 추적(M = 45.20, SD = 13.10)에서도 낮은 수준을 유지하였다. 모클리 검정 결과 구형성 가정이 충족되었다(W = 0.94, p = .312).
반복측정 분산분석 결과, 시간이 불안 점수에 미치는 효과가 통계적으로 유의하였다, F(2, 78) = 18.45, p < .001, η2p = .32. 본페로니 보정을 적용한 사후 비교에서 기저선과 치료 후(Mdiff = 13.75, p < .001, d = 1.14), 기저선과 추적(Mdiff = 17.30, p < .001, d = 1.36) 간 유의한 차이가 있었으나, 치료 후와 추적 간 차이는 유의하지 않았다(p = .312).
표를 이용한 보고
종속변수가 여러 개이거나 설계가 복잡한 논문에서는 ANOVA 요약표를 사용합니다:
| 변동원 | df | F | p | η2p | |--------|------|------|------|---| | 시간 | 2 | 18.45 | < .001 | .32 | | 오차 | 78 | | | |
그린하우스-가이서 보정을 적용한 경우 보정된 자유도를 포함합니다:
| 변동원 | df | F | p | η2p | ε | |--------|------|------|------|---|---| | 시간 | 1.56 | 18.45 | < .001 | .32 | 0.78 | | 오차 | 60.84 | | | | |
구형성: 개념과 중요성
구형성은 세 개 이상의 수준을 가진 반복측정 설계에 고유한 수학적 가정입니다. 공식적으로, 모든 조건 쌍 간 차이 점수의 분산이 동일해야 합니다. 예를 들어, 세 시점(T1, T2, T3)에서 (T1 - T2)의 분산, (T1 - T3)의 분산, (T2 - T3)의 분산이 모두 같아야 합니다.
구형성이 중요한 이유
구형성이 위반되면 F 통계량이 과대추정되어 1종 오류율이 증가합니다. 즉, 실제로는 유의하지 않은 효과를 유의하다고 결론내릴 수 있습니다. 위반의 심각도는 엡실론(ε)으로 수량화됩니다. 엡실론 1.00은 완전한 구형성을, 낮은 값은 심한 위반을 나타냅니다. 엡실론의 하한값은 1/(k - 1)이며, k는 조건의 수입니다.
모클리 검정 상세
모클리 검정은 구형성 가정의 충족 여부를 평가합니다. 유의한 결과(p < .05)는 구형성 위반을 나타냅니다. 그러나 모클리 검정에는 두 가지 중요한 제한점이 있습니다. 소표본에서는 위반을 탐지하는 검정력이 부족하여 구형성이 충족되지 않아도 충족된 것으로 판단할 수 있습니다. 대표본에서는 F 검정에 실질적 영향이 없는 사소한 위반도 유의하게 나타날 수 있습니다. 일부 연구자들은 모클리 검정 결과와 무관하게 항상 보정을 적용할 것을 권장합니다.
엡실론 보정 비교
그린하우스-가이서는 보수적인 보정입니다. 분자와 분모 자유도 모두에 엡실론을 곱하여 조정합니다. 이로 인해 자유도가 감소하여 유의성 달성이 어려워집니다. 대부분의 분야에서 기본 보정으로 권장됩니다.
훈-펠트는 덜 보수적인 보정입니다. 실제 엡실론이 0.75 이상일 때 그린하우스-가이서보다 과소보정이 적습니다. 표준 권장사항은:
ε < .75이면 그린하우스-가이서, ε ≥ .75이면 훈-펠트를 사용합니다.
구형성 위반 시 APA 보고:
모클리 검정 결과 구형성 가정이 위반되었다, χ2(2) = 8.41, p = .015. 그린하우스-가이서 보정을 적용하였다(ε = .72). 보정된 결과, 조건의 효과가 유의하였다, F(1.44, 56.16) = 14.23, p < .001, η2p = .27.
모클리 검정은 카이제곱 통계량과 자유도를 함께 보고할 수 있습니다. 모클리 검정의 카이제곱 자유도는 k(k - 1)/2 - 1이며, k는 수준의 수입니다.
대안: 다변량 접근법
구형성이 심하게 위반된 경우(ε < .60), 다변량 접근법(MANOVA)은 구형성 가정에 의존하지 않는 F 통계량을 제공합니다. 대부분의 통계 소프트웨어는 Pillai's Trace, Wilks' Lambda, Hotelling's Trace, Roy's Largest Root 네 가지 다변량 검정 통계량을 출력합니다. Pillai's Trace가 가장 강건합니다.
다변량 접근법의 APA 형식:
구형성이 심하게 위반되었으므로(ε = .52) 다변량 검정을 사용하였다. Pillai's Trace를 사용한 결과, 조건의 효과가 유의하였다, V = 0.61, F(2, 38) = 29.72, p < .001, η2p = .61.
다변량 접근법은 n > k(참여자 수가 조건 수보다 많아야)를 요구하며, 이것이 항상 가능하지는 않습니다.
사후 쌍별 비교: 심화 가이드
전체 반복측정 ANOVA가 유의할 때, 사후 쌍별 비교로 어떤 조건 또는 시점이 다른지 구체적으로 확인합니다. 반복측정 설계에서 이러한 비교는 일반적으로 다중비교 보정을 적용한 대응표본 t-검정으로 수행합니다.
본페로니 보정
본페로니 보정은 유의수준을 비교 횟수로 나눕니다. 세 조건의 경우 3개의 쌍별 비교가 있으므로, 보정된 알파는 .05 / 3 = .0167입니다. p < .0167인 비교만 유의한 것으로 판단합니다.
대안으로, 각 원시 p 값에 비교 횟수를 곱하여(상한 1.0) .05와 비교할 수 있습니다. 대부분의 소프트웨어가 보정된 p 값을 직접 출력합니다.
다수 시점의 결과 정리
네 개 이상의 시점이 있을 때 쌍별 비교의 수가 빠르게 증가합니다. 네 조건은 6개, 다섯 조건은 10개의 비교를 생성합니다. 명확한 전달을 위해 쌍별 비교 표를 사용합니다:
| 비교 | Mdiff | SE | padj | d | |------|------|------|------|------| | T1 vs. T2 | 13.75 | 2.41 | < .001 | 1.14 | | T1 vs. T3 | 17.30 | 2.68 | < .001 | 1.36 | | T2 vs. T3 | 3.55 | 2.15 | .312 | 0.28 |
다중비교의 APA 형식
다수의 쌍별 비교를 본문에 보고할 때는 모든 쌍을 나열하지 말고 논리적으로 묶어서 기술합니다:
본페로니 보정을 적용한 쌍별 비교 결과, 1주차 점수(M = 72.40)는 이후 모든 시점보다 유의하게 높았다(ps < .01). 4주차(M = 51.20)와 8주차(M = 48.90)의 점수는 유의한 차이가 없었다(p = .418).
이 접근법은 핵심 패턴을 전달하면서 서술을 읽기 쉽게 유지합니다. 모든 쌍별 결과를 담은 보충 표를 별도로 포함하세요.
계획된 대비 vs. 사후 비교
데이터 수집 전에 구체적인 가설이 있을 때, 계획된 대비(planned contrasts)는 가능한 모든 비교에 대한 보정이 필요 없으므로 사후 검정보다 검정력이 높습니다. 반복측정에서 일반적인 계획 대비는:
- 선형 추세(linear trend): 등간격 조건에서 점수가 선형적으로 증가/감소하는지 검정
- 이차 추세(quadratic trend): 점수가 U자형 또는 역U자형 패턴을 따르는지 검정
- 헬머트 대비(Helmert contrasts): 각 수준을 이후 수준들의 평균과 비교
추세 분석의 APA 형식:
다항 대비 분석 결과, 유의한 선형 추세가 나타났다, F(1, 39) = 34.12, p < .001, η2p = .47. 이는 불안 점수가 시간에 따라 꾸준히 감소했음을 나타낸다. 이차 추세는 유의하지 않았다, F(1, 39) = 2.03, p = .162, η2p = .05.
본페로니 대안
본페로니는 반복측정 사후 검정에서 가장 일반적인 보정이지만, 비교 횟수가 많을 때 지나치게 보수적일 수 있습니다. 대안으로:
- 홀름-본페로니(Holm-Bonferroni): 본페로니보다 검정력이 높으면서 가족별 오류율을 동일하게 통제하는 단계적 절차
- 시닥 보정(Sidak correction): 본페로니보다 약간 덜 보수적, 1 - (1 - .05)^(1/k)로 계산
- 허위발견율(FDR): 가족별 오류율 대신 예상 허위발견 비율을 통제, 탐색적 분석에 적합
보고서에 사용한 보정 방법을 반드시 명시하여 독자가 다중비교 보정의 엄격성을 평가할 수 있게 하세요.
반복측정 효과크기: 부분 에타제곱을 넘어서
부분 에타제곱이 반복측정 ANOVA의 전체 검정에서 가장 일반적으로 보고되는 효과크기이지만, 보완적 정보를 제공하는 다른 효과크기 측정치가 있습니다.
부분 에타제곱 (η2p)
부분 에타제곱은 분모에서 피험자 간 변동성을 제거하여 피험자 내 설계의 표준적 선택이 됩니다. "개인차로 설명되지 않는 분산 중에서 실험 요인이 얼마나 설명하는가?"라는 질문에 답합니다.
η2p = SS효과 / (SS효과 + SS오차)
APA 형식:
조건의 효과가 큰 효과와 함께 유의하였다, F(2, 78) = 18.45, p < .001, η2p = .32.
일반화 에타제곱 (η2G)
일반화 에타제곱(Olejnik & Algina, 2003; Bakeman, 2005)은 서로 다른 설계의 연구 간 효과크기를 비교하기 위해 설계되었습니다. 부분 에타제곱과 달리, 측정된 요인과 조작된 요인을 구분하여 측정된 요인의 변동성만 분모에 포함합니다. 이로 인해 메타분석에서의 비교에 더 적합합니다.
η2G = SS효과 / (SS효과 + SS피험자 + SS오차)
일반화 에타제곱은 분모에 피험자 변동성을 포함하므로 동일 데이터에서 부분 에타제곱보다 작은 값을 보입니다. 별도의 기준은 없으며, Cohen(1988)의 에타제곱 기준(.01, .06, .14)을 사용합니다.
APA 형식:
F(2, 78) = 18.45, p < .001, η2G = .18.
오메가 제곱 (ω2)
오메가 제곱은 에타제곱보다 편향이 적은 효과크기 추정치로, 특히 소표본에서 유용합니다. 부분 에타제곱이 모집단 효과를 과대추정하는 경향이 있는 반면, 오메가 제곱은 보정을 적용합니다:
ω2 = (SS효과 - df효과 * MS오차) / (SS전체 + MS피험자)
오메가 제곱은 출판된 연구에서 덜 보고되지만 정확성 면에서 높이 평가됩니다. 보고할 경우 에타제곱과 같은 기준(.01, .06, .14)을 사용합니다.
APA 형식:
F(2, 78) = 18.45, p < .001, ω2 = .28.
쌍별 비교의 Cohen's d
개별 쌍별 비교에서는 차이 점수의 표준편차 또는 풀링된 조건 내 표준편차를 사용하여 Cohen's d를 보고합니다. 공식은 접근법에 따라 달라집니다:
- dz = Mdiff / SDdiff (차이 점수의 SD 사용; 대응 설계 반영)
- dav = Mdiff / average(SD1, SD2) (두 조건 SD의 평균 사용; 연구 간 비교에 적합)
dz는 차이 점수의 SD가 일반적으로 개별 조건의 SD보다 작으므로 dav보다 큰 경향이 있습니다. 어떤 공식을 사용했는지 명시합니다:
기저선에서 치료 후로의 감소는 큰 효과에 해당하였다, dav = 1.14.
Cohen's d 해석 기준:
| d | 해석 | |-----|------| | 0.20 | 작은 효과 | | 0.50 | 중간 효과 | | 0.80 | 큰 효과 |
복수 효과크기 보고
완전한 보고를 위해 전체 검정에는 부분 에타제곱을, 각 쌍별 비교에는 Cohen's d를 포함합니다:
반복측정 ANOVA에서 유의한 효과가 나타났다, F(2, 78) = 18.45, p < .001, η2p = .32. 쌍별 비교 결과, 기저선 대 치료 후(d = 1.14)와 기저선 대 추적(d = 1.36)에서 큰 효과가, 치료 후 대 추적(d = 0.28)에서 작은 효과가 나타났다.
혼합설계 ANOVA: 피험자 간·내 요인의 결합
혼합설계(또는 분할구획) ANOVA는 최소 하나의 피험자 간 요인과 하나의 피험자 내 요인을 결합합니다. 예를 들어, 두 치료 집단(CBT vs. 약물치료)을 세 시점(기저선, 치료 후, 추적)에 걸쳐 비교할 수 있습니다. 이 설계는 임상 및 교육 연구에서 매우 일반적입니다.
보고해야 할 핵심 요소
혼합설계 ANOVA는 세 가지 효과를 산출합니다:
- 피험자 간 주효과: 시간을 통합한 집단 간 차이
- 피험자 내 주효과: 집단을 통합한 시간에 따른 차이
- 상호작용 효과: 시간에 따른 패턴이 집단 간에 다른지 여부
혼합설계의 APA 보고 형식
모든 피험자 내 효과에 대해 구형성 정보를 보고한 후 각 효과를 제시합니다:
피험자 간 효과 (집단): 집단의 주효과는 유의하지 않았다, F(1, 38) = 2.14, p = .152, η2p = .05.
피험자 내 효과 (시간): 모클리 검정 결과 시간 주효과에 대한 구형성 가정이 충족되었다, W = 0.91, p = .245. 시간이 불안 점수에 미치는 주효과가 유의하였다, F(2, 76) = 22.31, p < .001, η2p = .37.
상호작용 효과 (집단 x 시간): 집단과 시간의 상호작용이 유의하였다, F(2, 76) = 6.89, p = .002, η2p = .15. 이는 불안 점수의 시간적 변화 양상이 CBT 집단과 약물치료 집단 간에 달랐음을 나타낸다.
상호작용 효과의 해석과 보고
상호작용이 유의하면 주효과의 의미가 줄어듭니다. 한 요인의 효과가 다른 요인의 수준에 따라 달라지기 때문입니다. 후속 분석으로:
- 단순효과 분석: 피험자 간 요인의 각 수준에서 피험자 내 효과를 별도로 검정
- 쌍별 비교: 각 시점에서 집단을 비교하거나, 각 집단 내에서 시점을 비교
상호작용 후속 분석 예시:
단순효과 분석 결과, CBT 집단은 시간에 따른 불안의 유의한 감소를 보였으며(F(2, 38) = 24.56, p < .001, η2p = .56), 약물치료 집단은 더 작지만 유의한 감소를 보였다(F(2, 38) = 5.12, p = .011, η2p = .21). 추적 시점에서 CBT 집단의 불안이 약물치료 집단보다 유의하게 낮았다, t(38) = 2.67, p = .011, d = 0.84.
혼합설계에서의 구형성
혼합설계에서 구형성은 피험자 내 효과(주효과 및 피험자 내 요인이 포함된 상호작용)에만 적용됩니다. 피험자 간 효과는 구형성 검정이 필요하지 않습니다. 각 피험자 내 효과에 대해 모클리 검정을 별도로 보고합니다.
혼합설계 완전 보고 예시
혼합설계 ANOVA의 전체 결과 섹션:
결과
불안 점수에 대해 2(집단: CBT vs. 약물치료) x 3(시간: 기저선, 치료 후, 추적) 혼합설계 ANOVA를 실시하였다.
기술통계는 표 1에 제시하였다. 모클리 검정 결과, 시간 주효과(W = 0.91, p = .245)와 집단 x 시간 상호작용(W = 0.89, p = .198) 모두에서 구형성이 충족되었다.
집단의 주효과는 유의하지 않았다(F(1, 38) = 2.14, p = .152, η2p = .05). 시간의 주효과는 유의하였다(F(2, 76) = 22.31, p < .001, η2p = .37). 집단 x 시간 상호작용이 유의하였다(F(2, 76) = 6.89, p = .002, η2p = .15).
단순효과 분석 결과, CBT 집단이 약물치료 집단보다 시간에 따른 불안 감소가 더 컸다(η2p = .56 vs. .21). 추적 시점에서 CBT 집단의 불안이 약물치료 집단보다 유의하게 낮았다, t(38) = 2.67, p = .011, d = 0.84.
반복측정 ANOVA 보고의 흔한 실수
1. 구형성 검정 완전 누락
가장 흔한 실수는 구형성에 대한 언급 자체를 생략하는 것입니다. 가정이 충족되더라도 이를 명시적으로 기술해야 합니다. 심사자와 독자가 확인했는지 알아야 합니다.
오류: "반복측정 분산분석 결과 유의한 효과가 나타났다, F(2, 78) = 18.45, p < .001."
올바름: F 통계량 전에 모클리 검정 결과를 포함합니다.
2. 적용한 보정 방법 미보고
구형성이 위반되었을 때 보정된 자유도만 보고하고 보정 방법을 명시하지 않는 경우가 있습니다. 그린하우스-가이서를 사용했는지 훈-펠트를 사용했는지 반드시 명시하고 엡실론 값을 보고합니다.
오류: "F(1.56, 60.84) = 18.45, p < .001."
올바름: "그린하우스-가이서 보정을 적용하여(ε = .78), F(1.56, 60.84) = 18.45, p < .001."
3. 잘못된 오차항 사용
반복측정 설계에서 각 피험자 내 효과는 고유한 오차항을 가집니다. 피험자 간 ANOVA의 전체 오차항을 사용하지 마세요. 오차 자유도는 (k - 1)(n - 1)이어야 합니다(k = 조건 수, n = 참여자 수).
4. 두 수준에서 대응표본 t-검정과 혼동
피험자 내 요인이 두 수준만 있을 때 반복측정 ANOVA와 대응표본 t-검정은 동일한 결과를 산출합니다(F = t2). 이 경우 대응표본 t-검정이 더 간단하고 선호됩니다. 두 수준에서는 구형성이 자동으로 충족되기 때문입니다(차이 점수가 하나뿐이므로 비교할 것이 없습니다). 세 개 이상의 조건에서 반복측정 ANOVA를 사용하세요.
5. 이월효과와 순서효과 무시
참여자가 모든 조건을 경험하는 피험자 내 설계에서는 조건의 순서가 결과에 영향을 미칠 수 있습니다. 피로, 연습, 민감화 효과가 한 조건에서 다음으로 이월될 수 있습니다. 다음과 같이 대처합니다:
- 참여자 간 조건 순서를 역균형화
- 혼합설계 분석에서 순서를 피험자 간 요인으로 포함
- 순서효과를 검정하고 비유의했음을 보고
예시:
조건 순서는 참여자 간에 역균형화되었다. 순서를 피험자 간 요인으로 포함한 예비 분석 결과, 순서의 주효과(F(2, 37) = 0.45, p = .641)와 순서 x 조건 상호작용(F(4, 74) = 1.12, p = .354)이 모두 유의하지 않았다.
6. 쌍별 비교 효과크기 누락
전체 부분 에타제곱만 보고하고 개별 쌍별 비교의 효과크기를 생략하면, 독자가 어떤 차이가 실질적으로 의미 있는지 판단할 수 없습니다. η2p = .25인 유의한 전체 검정이 하나의 큰 쌍별 차이와 여러 사소한 차이를 반영할 수 있습니다. 각 비교에 Cohen's d를 포함하세요.
7. 에타제곱과 부분 에타제곱 혼동
반복측정 설계에서는 항상 η2p(부분)을 사용합니다. η2(일반)은 피험자 간 변동성을 포함하여 피험자 내 효과를 과소추정합니다. SPSS는 이를 "Partial Eta Squared"로 표시합니다.
8. p값 형식 오류
APA 7판은 정확한 p 값(예: p = .013)을 요구하며, p < .05와 같은 부등호 표현은 사용하지 않습니다. p < .001인 경우에만 예외적으로 이 형식이 허용됩니다. p = .000이라고 절대 쓰지 마세요.
SPSS, R, JASP 출력 해석
SPSS 출력 읽기
SPSS는 "Tests of Within-Subjects Effects" 표에 네 행을 출력합니다: Sphericity Assumed, Greenhouse-Geisser, Huynh-Feldt, Lower-bound. 먼저 별도의 "Mauchly's Test of Sphericity" 표에서 모클리 검정을 확인합니다. 구형성이 충족되면(p > .05) "Sphericity Assumed" 행을, 위반되면 Greenhouse-Geisser 행을 보고합니다(엡실론이 .75 이상이면 Huynh-Feldt). "Partial Eta Squared" 열에서 효과크기를 직접 확인할 수 있습니다.
R 출력 읽기
R에서 ez 패키지의 ezANOVA() 함수는 모클리 검정, 그린하우스-가이서 및 훈-펠트 엡실론 값, 보정된 p-값을 자동으로 제공합니다. rstatix 패키지의 anova_test() 함수도 유사한 출력을 제공합니다. 사후 비교에는 pairwise_t_test()에 paired = TRUE와 p.adjust.method = "bonferroni"를 사용합니다.
JASP 출력 읽기
JASP는 구형성 보정이 조건부로 표시되는 깔끔한 표 형식으로 결과를 제시합니다. 옵션에서 "Assumption Checks"를 활성화하면 모클리 검정을 확인할 수 있습니다. JASP는 부분 에타제곱과 함께 일반화 에타제곱도 기본적으로 계산하므로 메타분석 보고에 유용합니다.
자주 묻는 질문
반복측정 ANOVA와 일원분산분석의 차이는?
일원분산분석은 서로 다른 참여자로 구성된 집단 간 평균을 비교하는 피험자 간 설계입니다. 반복측정 ANOVA는 동일한 참여자를 여러 조건이나 시점에서 측정하는 피험자 내 설계입니다. 반복측정 ANOVA는 오차항에서 개인차를 제거하므로 더 높은 검정력을 가지지만, 추가적인 구형성 가정을 필요로 합니다. 각 집단에 서로 다른 참여자가 있을 때는 일원분산분석을, 동일 참여자를 반복 측정할 때는 반복측정 ANOVA를 사용합니다.
시점이 두 개인 경우 반복측정 ANOVA를 사용할 수 있는가?
기술적으로 가능하지만, 두 시점에서는 대응표본 t-검정이 선호됩니다. 두 조건만 있을 때 구형성은 자동으로 충족되며(차이 점수 쌍이 하나뿐), F 통계량은 t 제곱과 같습니다. 대응표본 t-검정이 보고와 해석이 더 간단합니다. 구형성 가정이 관련되고 사후 비교가 필요한 세 개 이상의 조건에서 반복측정 ANOVA를 사용하세요.
구형성이 위반되면 어떻게 해야 하는가?
그린하우스-가이서 보정(기본 권장) 또는 훈-펠트 보정(엡실론이 .75 이상일 때)을 적용합니다. 이 보정은 자유도를 감소시켜 F 검정을 더 보수적으로 만듭니다. 엡실론 값과 사용한 보정 방법을 보고합니다. 대안으로 구형성을 가정하지 않는 다변량 검정(MANOVA)을 사용할 수 있지만, 더 큰 표본 크기가 필요하고 검정력 특성이 다릅니다.
반복측정 ANOVA에서 결측 데이터는 어떻게 처리하는가?
전통적인 반복측정 ANOVA는 목록별 삭제(listwise deletion)를 사용하여 어느 시점에서든 결측값이 있는 참여자를 제거합니다. 이로 인해 표본 크기가 상당히 줄어들 수 있습니다. 대안으로 분석 전 다중대입(multiple imputation)을 적용하거나, 결측-무작위(MAR) 가정 하에 사례를 삭제하지 않고 결측 데이터를 처리할 수 있는 선형혼합모형(linear mixed model)으로 전환할 수 있습니다. 결측 데이터의 양과 처리 방법을 보고합니다.
반복측정 ANOVA의 최소 표본 크기는?
절대적 최소값은 없지만, 검정력 분석으로 결정해야 합니다. 세 조건, 중간 효과(f = .25), alpha = .05, 검정력 = .80의 경우 약 28명의 참여자가 필요합니다. 필요한 표본 크기는 조건 수가 증가하거나(피험자 내 설계는 상관된 측정에서 검정력을 얻으므로) 조건 간 상관이 높을수록 감소합니다. G*Power와 같은 소프트웨어를 사용하여 반드시 공식적인 검정력 분석을 수행하세요.
반복측정 ANOVA 대신 MANOVA를 사용해야 하는가?
MANOVA(다변량 접근)는 구형성을 가정하지 않으므로 구형성이 심하게 위반된 경우에 적합합니다. 그러나 MANOVA는 더 큰 표본 크기(최소 참여자 수가 조건 수보다 많아야)를 필요로 하며, 구형성이 대략 충족될 때 보정된 단변량 접근법보다 검정력이 낮습니다. 보정된 단변량 접근법(그린하우스-가이서)이 MANOVA를 선호할 강력한 이유가 없는 한 기본적으로 권장됩니다.
비유의한 반복측정 ANOVA는 어떻게 보고하는가?
유의한 결과와 동일한 형식을 사용하며, 효과크기를 포함합니다. 예시: 반복측정 분산분석 결과, 시간이 불안 점수에 미치는 유의한 효과가 나타나지 않았다, F(2, 78) = 1.24, p = .295, η2p = .03. 전체 검정이 비유의할 때 사후 쌍별 비교를 실시하지 않습니다.
혼합설계에서 집단 크기가 다른 경우 반복측정 ANOVA를 사용할 수 있는가?
피험자 간 요인에서 집단 크기가 다르면 분석이 복잡해지지만 무효화되지는 않습니다. 불균형 설계에서는 Type III 제곱합(SPSS 기본값)을 사용합니다. 그러나 불균등한 집단 크기는 피험자 간 검정의 검정력을 감소시키고 분산-공분산 행렬의 동질성에 대해 F 검정이 민감해질 수 있습니다. 각 집단의 표본 크기를 보고하고 불균형이 대안적 접근법을 요구할 만큼 심각한지 검토합니다.
직접 분석해보기
무료 반복측정 ANOVA 계산기를 사용하면 구형성 검정, 그린하우스-가이서 보정, 부분 에타제곱, 본페로니 사후 비교까지 자동으로 계산하고 APA 형식 결과를 제공합니다.
요약
APA 7판에 따른 반복측정 ANOVA 보고는 표준 ANOVA를 넘어서는 세부 사항에 주의해야 합니다: 모클리 검정으로 구형성을 확인하고, 필요시 보정을 적용하며, 보정된 자유도를 보고하고, 효과크기로 부분 에타제곱을 사용하며, 효과크기가 포함된 쌍별 비교를 보고합니다. 혼합설계에서는 세 가지 효과(피험자 간, 피험자 내, 상호작용) 모두를 피험자 내 효과별 별도의 구형성 검정과 함께 보고합니다. 역균형화 절차를 보고하여 이월효과를 다루고, 전체 부분 에타제곱과 함께 각 쌍별 비교의 Cohen's d를 항상 포함합니다. 이 가이드의 템플릿과 예시를 따르면 첫 투고에서 학술지 기준을 충족하는 결과 섹션을 작성할 수 있습니다.