Wilcoxon符号順位検定を使用する場面
Wilcoxon符号順位検定は、対応のあるt検定のノンパラメトリック代替法です。対の差が正規分布していることを仮定せずに、同じ参加者からの2つの関連する測定値を比較します。
以下のいずれかに該当する場合、Wilcoxon符号順位検定を使用すべきです。
- 順序データ。 従属変数が順序尺度で測定されている(例:Likert尺度の評定、痛みの重症度ランキング)。
- 差の非正規性。 Shapiro-Wilk検定または視覚的検査により、対の差の分布が有意に歪んでいるか外れ値を含んでいることが明らかになった。
- 小さいサンプルサイズ。 対の数が20-25未満の場合、中心極限定理が対応のあるt検定のサンプリング分布を十分に正規化しない可能性がある。
- 順位付きまたは制限のあるデータ。 スコアに自然な床効果や天井効果があり、分布を歪める。
この検定は、対の観測値間の絶対差を順位付けし、元の差の符号を適用してから、符号付き順位の合計を計算することで機能します。一方の条件が一貫して高い値を生み出す場合、正の順位和と負の順位和が不等になります。
Wilcoxon符号順位検定計算ツールでお試しください。
検定統計量の理解:T、W、Z
Wilcoxon符号順位検定の報告で最も混乱を招く点の1つは、教科書やソフトウェア間で表記が一貫していないことです。3つの異なる記号が頻繁に登場し、正確なAPA報告のためにはそれぞれが何を表すかを理解することが不可欠です。
T(またはW):符号付き順位の合計
Wilcoxon検定の中核的な統計量は、正または負の差の順位の合計です。情報源によってラベルが異なります。
| 記号 | 慣例 | 使用されるソフトウェア |
|------|------|----------------------|
| T | 正の(または小さい方の)順位の合計 | 多くの統計学の教科書 |
| W | 符号付き順位の合計 | R (wilcox.test)、一部の教科書 |
| T+ | 特に正の順位の合計 | Siegel & Castellanの表記 |
小さいサンプル(一般的にn < 20)の場合、Wilcoxon分布から正確なp値を計算できるため、正確な検定統計量T(またはW)を直接報告します。
Z:標準化近似値
大きいサンプルの場合、ほとんどのソフトウェアは正規近似を使用して順位和をZ統計量に変換します。
Z = (T - 期待値) / 標準誤差
この標準化された値はおおむね正規分布に従い、公刊された研究で最もよく報告される統計量です。たとえば、SPSSはサンプルサイズに関係なく常にZ値を出力します。
使用するソフトウェアはどの記号を使うか?
| ソフトウェア | デフォルトの出力 | 記号 |
|------------|----------------|------|
| SPSS | 標準化検定統計量 | Z |
| R (wilcox.test) | 順位の合計 | V(紛らわしいことに) |
| Stata | 順位の合計 + Z近似 | z |
| jamovi | 検定統計量 + Z | WとZ |
| StatMate | 順位の合計とZの両方 | WとZ |
結果セクションを書く前に、報告される値が何を表しているかをソフトウェアのドキュメントで必ず確認してください。
APAの報告テンプレート
APA第7版はWilcoxon検定について単一の厳格なフォーマットを規定していませんが、以下のテンプレートは主要ジャーナルにおける現在のベストプラクティスを反映しています。
小さいサンプルの場合(正確検定)
小さいサンプルで正確なWilcoxon統計量を報告する場合:
Wilcoxon符号順位検定の結果、介入後のスコア(Mdn = 4.50)は介入前のスコア(Mdn = 3.00)よりも有意に高かった(T = 45, p = .012, r = .48)。
大きいサンプルの場合(Z近似)
ソフトウェアが標準化Z値を提供する場合:
Wilcoxon符号順位検定の結果、ベースライン(Mdn = 7.00, IQR = 5.00-8.00)からフォローアップ(Mdn = 4.00, IQR = 3.00-6.00)にかけて痛みの評定に統計的に有意な変化が認められた(Z = -3.41, p < .001, r = .54)。
必須要素
すべてのWilcoxon APA報告には以下を含める必要があります。
- 検定の正式名称を最初の言及時に記載する。
- 記述統計: 各条件の中央値(および理想的には四分位範囲)。平均値ではありません。
- 検定統計量: サンプルサイズとソフトウェアに応じてT、W、またはZ。
- 正確なp値(非常に小さい値の場合はp < .001)。
- 効果量: 順位二系列相関(r)。
- 差の方向: どちらの条件が高かったかを述べる。
効果量:順位二系列相関
p値の報告だけでは、差が統計的に有意かどうかはわかりますが、実践的に意味があるかどうかはわかりません。Wilcoxon符号順位検定の標準的な効果量は、rで表される順位二系列相関です。
計算方法
最も簡単な計算式はZ統計量を使用します。
r = Z / sqrt(N)
ここで、Nは対の観測値の総数です(一部の定式化では非ゼロの差の数ですが、慣行は異なります。情報源を確認してください)。
例: Z = -3.41、N = 40対の場合:
r = -3.41 / sqrt(40) = -3.41 / 6.32 = -0.54
符号は効果の方向を示します。大きさを記述する際は絶対値を報告します。
効果量の解釈
Cohenのrに関する慣例的なベンチマークが適用されます。
| rの値 | 解釈 | |---------|------| | .10 | 小さい効果 | | .30 | 中程度の効果 | | .50 | 大きい効果 |
上記の例でのr = .54は大きい効果を表しており、介入前から介入後にかけてスコアに実質的な変化があったことを示しています。
代替的な効果量指標
一部の研究者は、正と負の順位和から直接計算される対応のある順位二系列相関を報告します。
r = (R+ - R-) / (R+ + R-)
これは同等の解釈を生み、Zが利用できない場合に使用できます。
ステップバイステップの報告例
シナリオ
臨床心理士が、8週間のマインドフルネス介入の前後で32名の患者の不安レベル(1-10の順序尺度)を測定した。
ステップ1:記述統計を報告する
両条件の中央値と四分位範囲を提示します。
介入前の不安スコアの中央値は7.00(IQR = 6.00-8.00)、介入後のスコアの中央値は5.00(IQR = 3.25-6.00)であった。
ステップ2:ノンパラメトリック検定の選択を正当化する
不安は順序尺度で測定されており、Shapiro-Wilk検定により対の差の分布が正規性から有意に逸脱していたため(W = 0.91, p = .014)、対応のあるt検定の代わりにWilcoxon符号順位検定を使用した。
ステップ3:検定結果を報告する
Wilcoxon符号順位検定の結果、マインドフルネス介入後の不安スコア(Mdn = 5.00, IQR = 3.25-6.00)はベースライン(Mdn = 7.00, IQR = 6.00-8.00)と比較して有意に低かった(Z = -4.12, p < .001, r = .73)。これは大きい効果を表している。
ステップ4:文脈を追加する
32名の参加者のうち、27名が不安スコアの低下を示し、3名が上昇を示し、2名は変化がなかった。大きい効果量(r = .73)は、マインドフルネス介入が自己報告式の不安を実質的に低減したことを示唆している。
完全なAPAパラグラフ
すべての要素を1つの結果パラグラフにまとめます。
8週間のマインドフルネス介入が自己報告式の不安に与える効果を評価するため、Wilcoxon符号順位検定を使用した(N = 32)。不安は順序尺度で測定されており、対の差が正規分布していなかったため(Shapiro-Wilk W = 0.91, p = .014)、ノンパラメトリック検定を選択した。介入前の不安の中央値は7.00(IQR = 6.00-8.00)、介入後の不安の中央値は5.00(IQR = 3.25-6.00)であった。Wilcoxon符号順位検定は不安の統計的に有意な低下を示した(Z = -4.12, p < .001, r = .73)。32名の参加者のうち、27名がスコアの低下、3名がスコアの上昇、2名が変化なしであった。効果量は介入の大きい実践的効果を示している。
非有意な結果の報告
非有意な結果も同じレベルの詳細さで報告すべきです。隠したり、情報を減らしたりしないでください。
ワークショップ前(Mdn = 5.00, IQR = 4.00-6.00)と後(Mdn = 5.00, IQR = 4.00-7.00)の自己効力感の評定を比較するため、Wilcoxon符号順位検定を実施した。検定は自己効力感の統計的に有意な変化を示さなかった(Z = -1.34, p = .180, r = .21)。効果量は小さく、ワークショップが参加者の自己効力感に与えた影響は最小限であったことを示唆している。
非有意な結果の報告における重要な原則:
- 正確なp値を報告する(「p = n.s.」や「p > .05」と書かないこと)。
- 効果量も含め、解釈する。
- 関連があれば、観察された傾向の方向を記述する。
- 介入が「効果がなかった」と暗示する表現を避ける。代わりに、検定が有意な効果を検出しなかったと述べる。
Wilcoxon検定 vs 対応のあるt検定:選択ガイド
Wilcoxon符号順位検定と対応のあるt検定の選択は、個人の好みではなくデータの特性に依存します。
| 基準 | 対応のあるt検定 | Wilcoxon符号順位検定 | |------|---------------|---------------------| | データ尺度 | 間隔または比率 | 順序または連続 | | 差の分布 | おおむね正規 | 任意の分布 | | 外れ値への感度 | 高い | 低い(順位を使用) | | 比較対象 | 平均値 | 中央値/順位分布 | | 効果量 | Cohenのd | 順位二系列相関r | | 統計的検出力 | より高い(仮定充足時) | 対応のあるt検定の約95% | | 小さいサンプル (n < 20) | 非常に正規でない限り信頼性が低い | 適切 | | 記述統計 | 平均値とSD | 中央値とIQR |
対応のあるt検定を選択すべき場合
- 対間の差がおおむね正規分布している。
- 測定尺度が意味のある間隔を持つ連続変数である。
- 最大の統計的検出力が必要で、仮定が満たされている。
Wilcoxon検定を選択すべき場合
- データが順序的である(例:Likert尺度、順位)。
- 差が明らかに非正規、歪んでいる、または外れ値を含む。
- サンプルサイズが小さく、正規性を検証できない。
- 分布の仮定に依存しない頑健な検定が必要である。
両方の検定が妥当な場合、両方を実施して結果を比較する感度分析は合理的なアプローチです。一致する場合は、より馴染みのあるパラメトリック検定を報告します。一致しない場合は、Wilcoxon検定を報告し、その理由を説明します。
よくある間違い
1. T、W、Zの表記の混同
ソフトウェアパッケージや教科書によって、T、W、V、Zの意味が異なります。ソフトウェアの出力内容を常に確認し、報告書で正しくラベル付けしてください。不明な場合は、Z値を報告し、順位和を注記に記載します。
2. 中央値ではなく平均値を報告する
Wilcoxon検定は順位を分析するもので、生のデータ値ではありません。平均値と標準偏差を報告することは、検定が平均値の差を評価していないため誤解を招きます。記述統計として中央値と四分位範囲を報告してください。
3. 効果量を省略する
統計的に有意なp値は実践的重要性については何も述べていません。常に順位二系列相関を計算し報告してください。多くのジャーナルがすべての統計検定に効果量を要求しており、査読者はその欠如を指摘します。
4. ノンパラメトリック検定の選択を正当化しない
査読者は、なぜより検出力の高い対応のあるt検定を使用しなかったかを質問します。常に簡潔な正当化を提示してください。通常、データが順序的であること、Shapiro-Wilk検定が有意であったこと、または視覚的検査で非正規性が明らかになったことを記載します。
5. 同順位を無視する
複数の対が同一の差を持つ場合、同順位が発生します。ほとんどのソフトウェアは補正係数で同順位を処理しますが、大量の同順位は検定の精度に影響を与える可能性があることに注意してください。同順位が多い場合は言及してください。
Wilcoxon検定のAPAチェックリスト
論文提出前に、Wilcoxon検定の結果セクションに以下のすべての項目が含まれていることを確認してください。
- 最初の言及時に完全な検定名(Wilcoxon符号順位検定)
- サンプルサイズ(Nまたは対の数)
- 各条件の中央値(平均値ではなく)
- 各条件の四分位範囲(IQR)
- 明確にラベル付けされた検定統計量(T、W、またはZ)
- 正確なp値(またはp < .001)
- 効果量:順位二系列相関(r)
- 効果量の解釈(小さい、中程度、または大きい)
- 差の方向を明確に記述
- ノンパラメトリック検定を選択した正当化
- 同順位が多い場合はその言及
StatMateの無料Wilcoxon計算ツールをお試しください
Wilcoxonの結果を手作業でフォーマットするのは煩雑でミスが生じやすいです。StatMateのWilcoxon符号順位検定計算ツールは、プロセス全体を自動化します。
- 即座のAPA出力。 対のデータを入力するだけで、APA第7版基準でフォーマットされたZ、p、r値を含む論文用の結果パラグラフが得られます。
- 自動効果量計算。 順位二系列相関が自動的に計算・解釈されます。
- 仮定の検証。 対の差に対するShapiro-Wilk正規性検定と明確な合否表示。
- 視覚的出力。 対の差のチャートが参加者全体の変化の方向と大きさを示します。
- ワンクリックエクスポート。 フォーマット済みの結果をクリップボードにコピー、PDFにエクスポート、またはAPA形式のWord文書を生成(Pro)。
公式を調べる必要なし、表記の解読不要、フォーマットの心配なし。データを入力して、方法セクションに必要な結果パラグラフを取得してください。