통계에서 정규성이 중요한 이유
가장 흔히 사용되는 많은 통계 검정은 모수적 검정입니다 — 데이터가 정규분포를 따른다고 가정합니다. 이 가정이 심각하게 위반되면 결과가 신뢰할 수 없게 될 수 있습니다: 제1종 오류율이 증가하거나, 통계적 검정력이 감소하거나, 신뢰구간이 오해를 불러일으킬 수 있습니다.
다음 검정들은 모두 어떤 형태로든 정규성을 가정합니다:
- 독립 및 대응표본 t검정은 각 집단 내에서 종속변수(또는 차이 점수)가 정규분포한다고 가정합니다.
- 일원배치 및 반복측정 분산분석은 각 집단 또는 조건 내에서 잔차의 정규성을 가정합니다.
- Pearson 상관은 유의성 검정을 위해 이변량 정규성을 가정합니다.
- 선형 회귀는 잔차가 정규분포한다고 가정합니다.
정규성 가정을 위반한다고 해서 분석이 자동으로 무효화되는 것은 아닙니다. 큰 표본에서는 중심극한정리가 보호를 제공합니다. 그러나 작은 표본(n < 30)에서는 비정규성이 결과를 의미 있게 왜곡할 수 있습니다. 그래서 모수적 검정을 실시하기 전에 정규성을 확인하는 것이 양적 연구에서 모범 사례로 간주됩니다.
정규성 평가 방법
정규성을 평가하는 단일한 완벽한 방법은 없습니다. 모범 사례는 시각적 검사를 통계적 검정 및 기술적 지표와 결합하는 것입니다. 각 접근법에는 장단점이 있습니다.
시각적 방법
히스토그램은 분포의 형태를 빠르게 보여줍니다. 대략적으로 종 모양이고 대칭인 히스토그램은 정규성을 시사합니다. 그러나 히스토그램은 구간 너비에 민감하며 작은 표본에서는 오해의 소지가 있을 수 있습니다.
Q-Q 도표(분위수-분위수 도표)는 더 많은 정보를 제공합니다. 관찰된 데이터 분위수를 정규분포 하에서 기대되는 분위수와 대비하여 도표에 나타냅니다. 데이터가 정규분포라면 점들이 대략적으로 직선 대각선을 따라 위치합니다. 직선에서의 체계적인 이탈은 특정 유형의 비정규성을 나타냅니다.
통계적 검정
Shapiro-Wilk 검정은 약 2,000개 이하의 관측치를 가진 표본에 가장 널리 권장되는 정규성 검정입니다. 다양한 분포 유형에 걸쳐 강한 통계적 검정력을 제공합니다.
Kolmogorov-Smirnov 검정(Lilliefors 보정 적용)은 더 큰 표본에 종종 사용되는 대안입니다. 소규모에서 중간 규모의 표본에서 정규성 이탈을 탐지하는 데 Shapiro-Wilk보다 검정력이 낮습니다.
기술적 지표
왜도는 분포의 비대칭성을 측정합니다. 값이 0이면 완벽한 대칭을 나타냅니다. 양의 왜도는 오른쪽 꼬리가 더 길다는 것을, 음의 왜도는 왼쪽 꼬리가 더 길다는 것을 의미합니다.
첨도는 정규분포에 비해 꼬리의 두께를 측정합니다. 정규분포의 첨도는 3(또는 초과 첨도 0)입니다. 더 높은 값은 꼬리가 더 두껍고 이상값이 발생하기 쉬운 데이터를 나타냅니다.
Shapiro-Wilk 검정
Shapiro-Wilk 검정은 통계학 문헌에서 가장 권장되는 정규성 검정입니다. 모든 주요 통계 패키지에서 사용할 수 있으며, 많은 소프트웨어 프로그램에서 기본 정규성 검정으로 설정되어 있습니다.
사용 시기
표본 크기가 3에서 약 2,000 사이일 때 Shapiro-Wilk 검정을 사용합니다. 대부분의 연구 시나리오 — 학위논문, 학술지 논문, 수업 과제 — 에서 이 검정을 사용해야 합니다. 특히 작은 표본에서 비정규성 탐지에 Kolmogorov-Smirnov 검정보다 더 강력합니다.
해석 방법
검정은 0에서 1 사이의 W 통계량을 산출합니다. W 값이 1에 가까울수록 데이터가 정규분포를 밀접하게 따름을 나타냅니다. 낮은 값은 정규성에서 더 큰 이탈을 시사합니다.
의사결정 규칙은 간단합니다:
- p > .05이면 정규성의 귀무가설을 기각하지 않습니다. 데이터가 정규분포와 일치합니다.
- p ≤ .05이면 정규성을 기각합니다. 데이터가 정규분포에서 유의하게 이탈합니다.
실전 예제
25명의 학생으로부터 시험 점수를 수집했다고 가정합니다: Shapiro-Wilk 검정 결과 W = .964, p = .498이 산출되었습니다. p = .498이 .05보다 크므로 귀무가설을 기각하지 않습니다. 데이터가 정규성에서 유의하게 이탈하지 않으며, t검정이나 ANOVA와 같은 모수적 검정을 진행할 수 있습니다.
반대로, 검정 결과 W = .871, p = .005가 산출되었다면, 유의한 결과(p < .05)는 데이터가 정규분포에서 의미 있게 이탈함을 나타냅니다.
Kolmogorov-Smirnov 검정
Kolmogorov-Smirnov(K-S) 검정은 표본 분포를 이론적 정규분포와 비교하여 두 누적분포함수 간의 최대 절대 차이를 측정합니다.
사용 시기
K-S 검정은 Shapiro-Wilk 검정을 사용할 수 없는 더 큰 표본(n > 2,000)에 때때로 선호됩니다. 특히 SPSS는 탐색 절차에서 Shapiro-Wilk 검정과 함께 K-S 검정을 보고하는 등, 일부 소프트웨어 패키지가 K-S 검정을 기본으로 사용합니다.
한계
K-S 검정은 소규모 및 중간 규모 표본에서 Shapiro-Wilk 검정보다 통계적 검정력이 현저히 낮습니다. 이는 정규성에서의 실제 이탈을 놓칠 가능성이 더 높다는 것을 의미합니다. 두 검정이 모두 사용 가능하다면 Shapiro-Wilk 검정이 거의 항상 더 나은 선택입니다.
Lilliefors 보정
표준 K-S 검정은 평균과 표준편차를 사전에 지정해야 합니다. 이 매개변수들이 데이터에서 추정되는 경우(실무에서 거의 항상 그런 경우), Lilliefors 보정을 적용해야 합니다. 이 보정 없이는 검정이 지나치게 보수적이어서 비정규성을 탐지하지 못합니다. 대부분의 현대 소프트웨어는 Lilliefors 보정을 자동으로 적용합니다.
Q-Q 도표 해석
Q-Q 도표(분위수-분위수 도표)는 정규성을 평가하는 데 가장 유용한 시각적 도구 중 하나입니다. Q-Q 도표를 읽는 법을 배우면 통계적 검정만으로는 잘 특성화할 수 없는 분포적 문제를 진단하는 능력이 향상됩니다.
정규 Q-Q 도표의 모습
데이터가 정규분포일 때, Q-Q 도표의 점들은 대각선 참조선을 밀접하게 따릅니다. 선 주변의 사소한 무작위 산포는 예상되는 것이며 비정규성을 나타내지 않습니다. 핵심은 체계적인 이탈 패턴을 찾는 것입니다.
일반적인 패턴
| Q-Q 도표 패턴 | 해석 | |---|---| | 점들이 선을 밀접하게 따름 | 데이터가 근사 정규분포 | | 양쪽 끝이 선에서 벗어남(S자 형태) | 두꺼운 꼬리(첨도 과다) 또는 얇은 꼬리(첨도 과소) | | 오른쪽 끝에서 점들이 선 위로 곡선 | 우측(양의) 편향 | | 왼쪽 끝에서 점들이 선 아래로 곡선 | 좌측(음의) 편향 | | 한두 개의 점이 선에서 멀리 떨어짐 | 잠재적 이상값 | | 계단 또는 단계 패턴 | 데이터가 이산형이거나 반올림됨 |
Q-Q 도표는 p값만으로는 제공할 수 없는 진단 정보를 제공합니다. 예를 들어, 비정규성이 왜도, 두꺼운 꼬리, 이상값, 분포 혼합 중 어디에서 기인하는지 밝힐 수 있습니다. 이 정보는 문제를 어떻게 해결할지 결정하는 데 유용합니다.
왜도와 첨도 가이드라인
왜도와 첨도 값은 분포 형태의 수치적 요약을 제공합니다. 계산이 빠르며 시각적 검사 및 공식적 검정을 보완할 수 있습니다.
일반적인 경험 법칙
문헌에는 여러 지침이 존재합니다. 가장 흔히 인용되는 기준은 다음과 같습니다:
| 지표 | 허용 범위 | 출처 | |------|---------|------| | 왜도 | 절대값 2 미만 | West, Finch, & Curran (1995) | | 첨도(초과) | 절대값 7 미만 | West, Finch, & Curran (1995) | | 왜도(엄격) | 절대값 1 미만 | 실무에서 일반적으로 사용 | | 첨도(엄격) | 절대값 3 미만 | 실무에서 일반적으로 사용 |
일부 연구자들은 왜도와 첨도를 각각의 표준오차로 나누어 z점수를 계산하기도 합니다. 절대값 1.96을 초과하는 z점수(.05 수준)는 유의한 비정규성을 시사합니다. 그러나 이 접근법은 큰 표본에서 지나치게 민감해집니다.
실질적 조언
왜도와 첨도를 공식적 정규성 검정 및 시각적 검사의 대체가 아닌 보완으로 사용하십시오. 중간 정도의 위반(왜도 약 1, 첨도 약 3)은 중심극한정리 덕분에 표본 크기가 30 이상이면 대개 허용 가능합니다.
APA 형식으로 정규성 검정 보고하는 방법
결과 섹션에서 정규성 평가를 보고하면 투명성이 높아지고 방법론적 엄밀성을 보여줍니다. 다음은 두 가지 주요 정규성 검정을 APA 양식으로 포맷하는 방법입니다.
Shapiro-Wilk 보고
Shapiro-Wilk 검정 결과 시험 점수가 정규분포함을 나타냈다, W(25) = .964, p = .498.
Shapiro-Wilk 검정 결과 반응시간이 정규성에서 유의하게 이탈함을 보여주었다, W(42) = .871, p = .005.
Kolmogorov-Smirnov 보고
Lilliefors 보정을 적용한 Kolmogorov-Smirnov 검정 결과 불안 점수의 분포가 정규분포와 유의하게 다르지 않았다, D(150) = .054, p = .200.
Kolmogorov-Smirnov 검정 결과 소득 데이터에서 유의한 비정규성이 나타났다, D(500) = .112, p < .001.
전체 보고 예시
방법 또는 결과 섹션에서 다음과 같이 작성할 수 있습니다:
주 분석에 앞서 Shapiro-Wilk 검정과 Q-Q 도표의 시각적 검사를 통해 종속변수의 정규성을 평가하였다. 통제 집단, W(28) = .957, p = .302, 과 실험 집단, W(30) = .971, p = .563, 모두에서 시험 점수가 정규분포하였다. 왜도 값은 허용 범위 내에 있었다(통제: -0.34; 실험: 0.21). 따라서 독립표본 t검정을 실시하였다.
항상 어떤 정규성 검정을 사용했는지, 표본 크기, 검정 결과를 명시하십시오. 심사위원은 이 수준의 세부사항을 기대합니다.
데이터가 정규분포가 아닐 때 대처 방법
비정규성을 탐지하는 것은 첫 단계에 불과합니다. 이를 다루기 위한 전략이 필요합니다. 세 가지 주요 접근법이 있습니다.
방법 1: 데이터 변환
데이터 변환은 때때로 편향된 분포를 정규화할 수 있습니다. 일반적인 변환에는 다음이 포함됩니다:
- 로그 변환 — 우측 편향 데이터(예: 반응시간, 소득)에 효과적.
- 제곱근 변환 — 중간 정도로 우측 편향된 빈도 데이터에 유용.
- Box-Cox 변환 — 최적의 정규화 변환을 찾는 거듭제곱 변환 계열.
변환 후 변환된 변수에 대해 정규성 검정을 다시 실시합니다. 변환이 성공하면 변환된 데이터를 모수적 검정으로 분석할 수 있습니다. 그러나 결과가 변환된 척도에 있기 때문에 해석이 덜 직관적이 됩니다.
방법 2: 비모수적 대안 사용
변환이 도움이 되지 않거나 적절하지 않을 때, 정규성을 가정하지 않는 비모수적 검정으로 전환합니다:
| 모수적 검정 | 비모수적 대안 | |---|---| | 독립표본 t검정 | Mann-Whitney U 검정 | | 대응표본 t검정 | Wilcoxon 부호순위 검정 | | 일원배치 분산분석 | Kruskal-Wallis H 검정 | | 반복측정 분산분석 | Friedman 검정 |
비모수적 검정은 원시 값 대신 순위를 사용하여 분포 위반에 강건합니다. 대가는 정규성 가정이 실제로 충족될 때 통계적 검정력이 약간 감소한다는 것입니다.
방법 3: 모수적 검정 진행(큰 표본)
중심극한정리는 충분히 큰 표본에서 평균의 표본분포가 모집단 분포에 관계없이 정규성에 접근한다고 진술합니다. 일반적인 지침으로:
- 집단당 n > 30이면 중간 정도의 비정규성은 대개 허용 가능합니다.
- 집단당 n > 50이면 모수적 검정은 정규성 이탈 대부분에 강건합니다.
- 매우 큰 표본(n > 100)에서는 결과에 실질적 영향이 없는 사소한 이탈로 인해 정규성 검정이 종종 기각됩니다.
비정규성에도 불구하고 진행하는 경우, 논문에서 이를 인정하고 민감도 검정으로 모수적 결과와 비모수적 결과를 모두 보고하는 것을 고려하십시오.
흔한 실수
유의성 검정에만 의존
Shapiro-Wilk p값은 정규성에서의 이탈이 통계적으로 유의한지 알려주지만, 이탈이 얼마나 심한지는 알려주지 않습니다. 큰 표본에서는 사소하고 무의미한 이탈도 유의한 결과를 만들어냅니다. 항상 공식적 검정을 히스토그램과 Q-Q 도표의 시각적 검사와 결합하십시오.
Shapiro-Wilk가 더 적합할 때 K-S 사용
Kolmogorov-Smirnov 검정은 소규모 및 중간 규모 표본에서 Shapiro-Wilk 검정보다 검정력이 낮습니다. 표본 크기가 2,000 미만이고 두 검정이 모두 사용 가능하다면 Shapiro-Wilk를 선택하십시오. Shapiro-Wilk를 사용할 수 있는데 30명 표본에 K-S를 보고하면 검정 선택에 대한 심사위원의 우려를 야기할 수 있습니다.
"정규성을 기각하지 못함"과 "데이터가 정규분포"의 혼동
유의하지 않은 Shapiro-Wilk 결과(p > .05)는 정규성에 대한 증거를 찾지 못했다는 것을 의미합니다. 데이터가 정규분포임을 증명하는 것이 아닙니다. 이 구별은 특히 검정이 정규성 이탈을 탐지할 검정력이 제한적인 작은 표본에서 중요합니다.
사용한 검정 미보고
단순히 "데이터가 정규분포하였다"라고 쓰면서 검정명, 표본 크기, 결과를 명시하지 않는 것은 불충분합니다. 심사위원과 독자는 증거를 스스로 평가해야 합니다. 항상 검정명, 검정 통계량, 표본 크기, p값을 보고하십시오.
StatMate로 정규성 확인하기
StatMate는 t검정, ANOVA 및 기타 모수적 계산기에 Shapiro-Wilk 정규성 검정을 내장하고 있습니다. 데이터를 입력하면 StatMate가 자동으로 정규성 가정 검정을 실시하고 각 집단의 W 통계량과 p값을 표시합니다.
정규성 가정이 위반되면 StatMate는 적절한 비모수적 대안을 권장하고 해당 계산기로의 직접 링크를 제공합니다. 예를 들어, 독립표본 t검정을 실시했는데 Shapiro-Wilk 검정이 유의하면, StatMate가 Mann-Whitney U 검정으로 전환할 것을 제안합니다.
모든 정규성 검정 결과는 APA 형식 출력, PDF 내보내기, Word 내보내기에 포함됩니다 — 논문에 직접 붙여넣을 수 있습니다. statmate.org에서 무료 t검정 계산기나 ANOVA 계산기를 사용하여 가정 검정 기능을 직접 확인해 보세요.