본문으로 건너뛰기
S
StatMate
블로그 목록
APA 보고21 min read2026-03-07

Wilcoxon 부호순위 검정 APA 보고법: Z, W, 효과크기 & 예시 가이드

Wilcoxon 부호순위 검정 결과를 APA 7판 형식으로 보고하는 단계별 가이드입니다. T/W/Z 통계량, 순위이연상관 효과크기, 바로 복사할 수 있는 예시를 포함합니다.

Wilcoxon 부호순위 검정을 사용하는 경우

Wilcoxon 부호순위 검정은 대응표본 t 검정의 비모수적 대안입니다. 쌍 간 차이가 정규분포를 따른다는 가정 없이 동일한 참가자로부터 얻은 두 관련 측정값을 비교합니다.

다음 중 하나에 해당하면 Wilcoxon 부호순위 검정을 사용해야 합니다:

  • 서열 데이터. 종속변수가 서열 척도로 측정된 경우(예: 리커트형 평정, 통증 심각도 순위).
  • 비정규 차이. Shapiro-Wilk 검정이나 시각적 검사에서 대응 차이의 분포가 심하게 편포되어 있거나 이상값을 포함하는 경우.
  • 소규모 표본. 20-25쌍 미만이면 중심극한정리가 대응표본 t 검정을 위한 표집분포를 충분히 정규화하지 못할 수 있습니다.
  • 순위 또는 제한 데이터. 점수에 자연적인 바닥효과나 천장효과가 있어 분포를 왜곡하는 경우.

이 검정은 대응 관측값 간의 절대 차이에 순위를 매기고, 원래 차이의 부호를 적용한 후, 부호순위를 합산하는 방식으로 작동합니다. 한 조건이 일관되게 더 높은 값을 산출하면 양의 순위합과 음의 순위합이 불균등해집니다.

Wilcoxon 부호순위 계산기에서 직접 시도해 보세요.

검정통계량 이해: T, W, Z

Wilcoxon 부호순위 검정 보고에서 가장 혼란스러운 부분은 교과서와 소프트웨어 간의 일관성 없는 표기법입니다. 세 가지 다른 기호가 정기적으로 나타나며, 각각이 무엇을 나타내는지 이해하는 것이 정확한 APA 보고에 필수적입니다.

T(또는 W): 부호순위합

Wilcoxon 검정의 핵심 통계량은 양의 또는 음의 차이에 대한 순위합입니다. 출처에 따라 다르게 표기합니다:

| 기호 | 관례 | 사용처 | |------|------|--------| | T | 양의(또는 작은 쪽) 순위합 | 많은 통계 교과서 | | W | 부호순위합 | R (wilcox.test), 일부 교과서 | | T+ | 특별히 양의 순위합 | Siegel & Castellan 표기법 |

소규모 표본(일반적으로 n < 20)에서는 Wilcoxon 분포로부터 정확한 p값을 계산할 수 있으므로 정확 검정통계량 T(또는 W)를 직접 보고합니다.

Z: 표준화 근사값

더 큰 표본의 경우, 대부분의 소프트웨어는 정규근사를 사용하여 순위합을 Z 통계량으로 변환합니다:

Z = (T - 기대값) / 표준오차

이 표준화된 값은 대략적으로 정규분포를 따르며, 출판된 연구에서 가장 일반적으로 보고되는 통계량입니다. 예를 들어 SPSS는 표본 크기와 관계없이 항상 Z값을 출력합니다.

소프트웨어별 사용 기호

| 소프트웨어 | 기본 출력 | 기호 | |-----------|----------|------| | SPSS | 표준화 검정통계량 | Z | | R (wilcox.test) | 순위합 | V (혼란스럽게도) | | Stata | 순위합 + Z 근사 | z | | jamovi | 검정통계량 + Z | WZ | | StatMate | 순위합과 Z 모두 | WZ |

결과 섹션을 작성하기 전에 소프트웨어 문서를 확인하여 보고된 값이 무엇을 나타내는지 반드시 확인하십시오.

APA 보고 템플릿

APA 7판은 Wilcoxon 검정에 대해 단일한 엄격한 형식을 규정하지 않지만, 다음 템플릿은 주요 저널의 현재 모범 사례를 반영합니다.

소규모 표본(정확 검정)

소규모 표본에서 정확 Wilcoxon 통계량을 보고할 때:

Wilcoxon 부호순위 검정 결과, 중재 후 점수(Mdn = 4.50)가 중재 전 점수(Mdn = 3.00)보다 유의하게 높았다, T = 45, p = .012, r = .48.

대규모 표본(Z 근사)

소프트웨어가 표준화 Z값을 제공할 때:

Wilcoxon 부호순위 검정 결과, 기저선(Mdn = 7.00, IQR = 5.00-8.00)에서 추적 관찰(Mdn = 4.00, IQR = 3.00-6.00) 시점까지 통증 평점에서 통계적으로 유의한 변화가 나타났다, Z = -3.41, p < .001, r = .54.

필수 구성요소

모든 Wilcoxon APA 보고에는 다음이 포함되어야 합니다:

  1. 검정의 전체 이름을 첫 번째 언급 시 기재.
  2. 기술통계: 평균이 아닌, 각 조건의 중앙값(및 사분위범위).
  3. 검정통계량: 표본 크기와 소프트웨어에 따라 T, W, 또는 Z.
  4. 정확한 p값 (매우 작은 값이면 p < .001).
  5. 효과크기: 순위이연상관(r).
  6. 차이의 방향: 어느 조건이 더 높았는지 명시.

효과크기: 순위이연상관

p값만 보고하면 차이가 통계적으로 유의한지는 알 수 있지만 실질적으로 의미 있는지는 알 수 없습니다. Wilcoxon 부호순위 검정의 표준 효과크기는 r로 표기되는 순위이연상관(rank-biserial correlation)입니다.

계산 방법

가장 간단한 공식은 Z 통계량을 사용합니다:

r = Z / sqrt(N)

여기서 N은 대응 관측의 총 수입니다(일부 공식에서는 비영차이의 수를 사용하기도 하며, 관행이 다를 수 있으니 출처를 확인하십시오).

예시: Z = -3.41이고 N = 40쌍인 경우:

r = -3.41 / sqrt(40) = -3.41 / 6.32 = -0.54

부호는 효과의 방향을 나타냅니다. 크기를 기술할 때는 절대값을 보고합니다.

효과크기 해석

Cohen의 전통적 기준이 r에 적용됩니다:

| r 값 | 해석 | |--------|------| | .10 | 작은 효과 | | .30 | 중간 효과 | | .50 | 큰 효과 |

위의 예시에서 r = .54는 큰 효과를 나타내며, 중재 전후로 점수에 실질적인 변화가 있었음을 보여줍니다.

대안적 효과크기 측정치

일부 연구자는 양의 순위합과 음의 순위합으로부터 직접 계산한 대응쌍 순위이연상관을 보고합니다:

r = (R+ - R-) / (R+ + R-)

이는 동등한 해석을 제공하며, Z를 사용할 수 없을 때 사용할 수 있습니다.

단계별 보고 예시

시나리오

임상심리학자가 32명의 환자에게서 8주간의 마음챙김 중재 전후의 불안 수준(1-10 서열 척도)을 측정합니다.

1단계: 기술통계 보고

두 조건의 중앙값과 사분위범위를 제시합니다:

중재 전 불안 점수의 중앙값은 7.00(IQR = 6.00-8.00)이었고, 중재 후 점수의 중앙값은 5.00(IQR = 3.25-6.00)이었다.

2단계: 비모수 검정 선택 근거 제시

불안이 서열 척도로 측정되었고 Shapiro-Wilk 검정에서 대응 차이의 분포가 정규성으로부터 유의하게 벗어나는 것으로 나타나(W = 0.91, p = .014), 대응표본 t 검정 대신 Wilcoxon 부호순위 검정을 사용하였다.

3단계: 검정 결과 보고

Wilcoxon 부호순위 검정 결과, 마음챙김 중재 후 불안 점수(Mdn = 5.00, IQR = 3.25-6.00)가 기저선(Mdn = 7.00, IQR = 6.00-8.00)보다 유의하게 낮았다, Z = -4.12, p < .001, r = .73. 이는 큰 효과를 나타낸다.

4단계: 맥락 추가

32명의 참가자 중 27명이 불안 점수 감소를 보였고, 3명이 증가를 보였으며, 2명은 변화가 없었다. 큰 효과크기(r = .73)는 마음챙김 중재가 자기보고 불안의 실질적인 감소를 산출했음을 시사한다.

완전한 APA 문단

모든 요소를 단일 결과 문단으로 결합하면:

8주간의 마음챙김 중재가 자기보고 불안에 미치는 효과를 평가하기 위해 Wilcoxon 부호순위 검정을 사용하였다(N = 32). 불안이 서열 척도로 측정되었고 대응 차이가 정규분포를 따르지 않아(Shapiro-Wilk W = 0.91, p = .014) 비모수 검정을 선택하였다. 중재 전 불안의 중앙값은 7.00(IQR = 6.00-8.00), 중재 후 불안의 중앙값은 5.00(IQR = 3.25-6.00)이었다. Wilcoxon 부호순위 검정 결과, 불안에서 통계적으로 유의한 감소가 나타났다, Z = -4.12, p < .001, r = .73. 32명의 참가자 중 27명이 점수 감소를, 3명이 점수 증가를, 2명이 변화 없음을 보였다. 효과크기는 중재의 큰 실질적 효과를 나타낸다.

비유의한 결과 보고

비유의한 결과도 동일한 수준의 세부사항으로 보고해야 합니다. 이를 숨기거나 더 적은 정보를 제공해서는 안 됩니다.

훈련 워크숍 전(Mdn = 5.00, IQR = 4.00-6.00)과 후(Mdn = 5.00, IQR = 4.00-7.00)의 자기효능감 평정을 비교하기 위해 Wilcoxon 부호순위 검정을 실시하였다. 검정 결과, 자기효능감에서 통계적으로 유의한 변화가 나타나지 않았다, Z = -1.34, p = .180, r = .21. 작은 효과크기는 워크숍이 참가자의 자기효능감 신념에 최소한의 영향을 미쳤음을 시사한다.

비유의한 결과에 대한 핵심 원칙:

  • 정확한 p값을 보고하십시오("p = n.s." 또는 "p > .05"로 쓰지 마십시오).
  • 여전히 효과크기를 포함하고 해석하십시오.
  • 관련이 있다면 관찰된 경향의 방향을 기술하십시오.
  • 중재가 "효과가 없었다"고 암시하는 표현을 피하십시오. 대신, 검정이 유의한 효과를 탐지하지 못했다고 기술합니다.

Wilcoxon vs 대응표본 t 검정: 선택 가이드

Wilcoxon 부호순위 검정과 대응표본 t 검정 중 어떤 것을 선택할지는 개인적 선호가 아니라 데이터의 특성에 따라 결정됩니다.

| 기준 | 대응표본 t 검정 | Wilcoxon 부호순위 | |------|---------------|------------------| | 데이터 척도 | 등간 또는 비율 | 서열 또는 연속형 | | 차이의 분포 | 대략적으로 정규 | 모든 분포 | | 이상값 민감도 | 높음 | 낮음(순위 사용) | | 비교 대상 | 평균 | 중앙값 / 순위 분포 | | 효과크기 | Cohen의 d | 순위이연상관 r | | 통계적 검정력 | 더 높음(가정 충족 시) | 대응표본 t 검정의 ~95% | | 소규모 표본 (n < 20) | 매우 정규적이지 않으면 불안정 | 적절함 | | 기술통계 | 평균과 SD | 중앙값과 IQR |

대응표본 t 검정을 선택하는 경우

  • 쌍 간 차이가 대략적으로 정규분포를 따르는 경우.
  • 측정 척도가 의미 있는 간격을 가진 연속형인 경우.
  • 가정이 유지되는 상태에서 최대 통계적 검정력을 원하는 경우.

Wilcoxon 검정을 선택하는 경우

  • 데이터가 서열형인 경우(예: 리커트 척도, 순위).
  • 차이가 명확히 비정규이고, 편포되어 있거나, 이상값을 포함하는 경우.
  • 표본 크기가 작아 정규성을 확인할 수 없는 경우.
  • 분포 가정에 의존하지 않는 강건한 검정을 원하는 경우.

두 검정이 모두 타당하다면, 둘 다 실시하여 결과를 비교하는 것이 합리적인 민감도 분석입니다. 결과가 일치하면 친숙도가 높은 모수 검정을 보고합니다. 결과가 불일치하면 Wilcoxon을 보고하고 그 이유를 설명합니다.

흔한 실수

1. T, W, Z 표기법 혼동

소프트웨어 패키지와 교과서마다 T, W, V, Z를 다른 의미로 사용합니다. 소프트웨어가 무엇을 출력하는지 항상 확인하고 보고서에 정확하게 표기하십시오. 의심스러우면 Z값을 보고하고 주석에 순위합을 포함합니다.

2. 중앙값 대신 평균 보고

Wilcoxon 검정은 원점수가 아닌 순위를 분석합니다. 평균과 표준편차를 보고하는 것은 검정이 평균의 차이를 평가하지 않기 때문에 오해를 줍니다. 기술통계로 중앙값과 사분위범위를 보고하십시오.

3. 효과크기 누락

통계적으로 유의한 p값은 실질적 중요성에 대해 아무것도 말하지 않습니다. 항상 순위이연상관을 계산하고 보고하십시오. 많은 저널이 현재 모든 통계 검정에 효과크기를 요구하며, 심사자는 그 부재를 지적할 것입니다.

4. 비모수 검정 선택 근거를 제시하지 않는 것

심사자는 왜 더 검정력이 높은 대응표본 t 검정을 사용하지 않았는지 물을 것입니다. 항상 간략한 근거를 제시하십시오 -- 일반적으로 데이터가 서열형이거나, Shapiro-Wilk 검정이 유의했거나, 시각적 검사에서 비정규성이 드러났다는 것입니다.

5. 동률 순위 무시

여러 쌍이 동일한 차이를 가지면 동률 순위가 발생합니다. 대부분의 소프트웨어는 보정 계수로 동률을 처리하지만, 많은 동률이 검정의 정밀도에 영향을 줄 수 있다는 점을 알고 있어야 합니다. 동률이 많으면 언급하십시오.

Wilcoxon APA 체크리스트

원고 제출 전에 Wilcoxon 결과 섹션에 이 체크리스트의 모든 항목이 포함되었는지 확인하십시오:

  • 첫 번째 언급 시 검정의 전체 이름(Wilcoxon 부호순위 검정)
  • 표본 크기(N 또는 쌍의 수)
  • 각 조건의 중앙값(평균이 아님)
  • 각 조건의 사분위범위(IQR)
  • 검정통계량(T, W, 또는 Z)을 명확히 표기
  • 정확한 p값(또는 p < .001)
  • 효과크기: 순위이연상관(r)
  • 효과크기 해석(작은, 중간, 큰)
  • 차이의 방향을 명시적으로 기술
  • 비모수 검정 선택 근거 제시
  • 동률이 많으면 언급

StatMate의 무료 Wilcoxon 계산기를 사용해 보세요

Wilcoxon 결과를 수동으로 포맷하는 것은 번거롭고 오류가 발생하기 쉽습니다. StatMate의 Wilcoxon 부호순위 계산기는 전체 과정을 자동화합니다:

  • 즉각적인 APA 출력. 대응 데이터를 입력하면 APA 7판 기준에 맞게 포맷된 Z, p, r 값이 포함된 출판 준비 결과 문단을 제공합니다.
  • 자동 효과크기. 순위이연상관이 자동으로 계산되고 해석됩니다.
  • 가정 검정. 대응 차이에 대한 Shapiro-Wilk 정규성 검정과 명확한 통과/미통과 지표를 제공합니다.
  • 시각적 출력. 대응 차이 차트가 참가자 간 변화의 방향과 크기를 보여줍니다.
  • 원클릭 내보내기. 포맷된 결과를 클립보드에 복사하거나, PDF로 내보내거나, APA 형식의 Word 문서를 생성합니다(Pro).

공식을 찾아볼 필요도, 표기법을 해독할 필요도, 서식을 의심할 필요도 없습니다. 데이터를 입력하고 방법 섹션에 필요한 결과 문단을 받으세요.

Wilcoxon 계산기 바로가기

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.