統計学において正規性が重要な理由
最も一般的に使用される統計検定の多くはパラメトリック検定です。これらはデータが正規分布に従うことを仮定しています。この仮定が重大に侵害されると、結果が信頼できなくなる可能性があります。第1種の誤りの膨張、統計的検出力の低下、信頼区間の歪みなどが生じ得ます。
以下の検定はすべて何らかの形で正規性を仮定しています:
- 対応のあるt検定と対応のないt検定は、従属変数(または差の得点)が各群内で正規分布していることを仮定します。
- 一元配置分散分析と反復測定分散分析は、各群または条件内の残差の正規性を仮定します。
- Pearson相関は、有意性検定のために二変量正規性を仮定します。
- 線形回帰は、残差が正規分布していることを仮定します。
正規性の仮定を侵害しても、分析が自動的に無効になるわけではありません。大標本では、中心極限定理が保護を提供します。しかし、小標本(nが30未満)では、非正規性が結果を意味のある形で歪める可能性があります。そのため、パラメトリック検定を実施する前に正規性を確認することは、量的研究におけるベストプラクティスとされています。
正規性を評価する方法
正規性を評価するための唯一の完璧な方法は存在しません。ベストプラクティスは、視覚的検査と統計的検定、記述的指標を組み合わせることです。各アプローチには長所と限界があります。
視覚的方法
ヒストグラムは、分布の形状をすばやく確認する手段を提供します。おおよそ釣鐘型で対称なヒストグラムは正規性を示唆します。ただし、ヒストグラムはビン幅に敏感で、小標本では誤解を招く可能性があります。
Q-Qプロット(分位数-分位数プロット)はより情報量が多い方法です。観測データの分位数を、正規分布のもとで期待される分位数に対してプロットします。データが正規であれば、点はおおよそ直線の対角線上に並びます。直線からの系統的な逸脱は、特定の種類の非正規性を明らかにします。
統計的検定
Shapiro-Wilk検定は、約2,000観測までのサンプルに対して最も広く推奨されている正規性検定です。さまざまな分布タイプにわたって強い統計的検出力を持っています。
Kolmogorov-Smirnov検定(Lilliefors修正付き)は、しばしばより大きなサンプルに対して使用される代替手法です。小〜中程度のサンプルにおける正規性からの逸脱の検出では、Shapiro-Wilk検定よりも検出力が低くなります。
記述的指標
歪度は、分布の非対称性を測定します。0の値は完全な対称を示します。正の歪度は右の裾が長いことを意味し、負の歪度は左の裾が長いことを意味します。
尖度は、正規分布に対する裾の厚さを測定します。正規分布の尖度は3(または超過尖度は0)です。値が大きいほど、裾が厚く外れ値が出やすいデータであることを示します。
Shapiro-Wilk検定
Shapiro-Wilk検定は、統計学の文献で最も推奨されている正規性検定です。すべての主要な統計ソフトウェアで利用可能であり、多くのプログラムでデフォルトの正規性検定となっています。
使用すべき場合
サンプルサイズが3から約2,000の場合にShapiro-Wilk検定を使用してください。ほとんどの研究シナリオ(卒業論文、学術誌論文、授業課題)では、この検定を使用すべきです。特に小標本における非正規性の検出において、Kolmogorov-Smirnov検定よりも検出力が高くなります。
解釈方法
検定は0から1の範囲の W 統計量を生成します。W 値が1に近いほど、データが正規分布に近いことを示します。値が低いほど、正規性からの逸脱が大きいことを示唆します。
判断基準は明快です:
- p > .05 の場合、正規性の帰無仮説を棄却しません。データは正規分布と一致しています。
- p ≤ .05 の場合、正規性を棄却します。データは正規分布から有意に逸脱しています。
具体的な例
25名の学生から試験得点を収集したとします。Shapiro-Wilk検定の結果、W = .964、p = .498 が得られました。p = .498 は .05 より大きいため、帰無仮説を棄却しません。データは正規性から有意に逸脱しておらず、t検定や分散分析などのパラメトリック検定を進めてよいことになります。
一方、W = .871、p = .005 という結果が得られた場合、有意な結果(p < .05)は、データが正規分布から意味のある形で逸脱していることを示します。
Kolmogorov-Smirnov検定
Kolmogorov-Smirnov(K-S)検定は、サンプル分布を理論的な正規分布と比較し、2つの累積分布関数間の最大絶対差を測定します。
使用すべき場合
K-S検定は、Shapiro-Wilk検定が利用できないような大きなサンプル(n > 2,000)に対して好まれることがあります。一部のソフトウェア、特にSPSSでは、探索的手続きにおいてShapiro-Wilk検定とともにK-S検定がデフォルトで報告されます。
限界
K-S検定は、小〜中程度のサンプルにおいてShapiro-Wilk検定よりも統計的検出力が著しく低いことが知られています。これは、正規性からの本当の逸脱を見逃す可能性が高いことを意味します。両方の検定が利用可能な場合、Shapiro-Wilk検定がほぼ常により良い選択です。
Lilliefors修正
標準的なK-S検定では、平均と標準偏差が事前に指定されていることが必要です。これらのパラメータがデータから推定される場合(実際にはほぼ常にそうです)、Lilliefors修正を適用する必要があります。この修正なしでは、検定は過度に保守的となり、非正規性を検出できなくなります。ほとんどの現代のソフトウェアはLilliefors修正を自動的に適用します。
Q-Qプロットの解釈
Q-Qプロット(分位数-分位数プロット)は、正規性を評価するための最も有用な視覚的ツールの一つです。Q-Qプロットの読み方を身につけると、統計的検定だけでは十分に特徴づけられない分布上の問題を診断する能力が向上します。
正規なQ-Qプロットの見え方
データが正規分布している場合、Q-Qプロット上の点は対角の参照線に沿って密接に並びます。線の周りの軽微なランダムなばらつきは予想されるものであり、非正規性を示すものではありません。重要なのは、系統的な逸脱パターンを探すことです。
よくあるパターン
| Q-Qプロットのパターン | 解釈 | |---------------------|------| | 点が線に沿って密接に並ぶ | データはほぼ正規分布している | | 両端が線から離れる(S字型) | 裾が厚い(尖鋭)または裾が薄い(扁平) | | 右端で点が線の上方に曲がる | 右(正の)歪み | | 左端で点が線の下方に曲がる | 左(負の)歪み | | 1〜2点が線から大きく離れている | 外れ値の可能性 | | 階段状・ステップパターン | データが離散的またはまるめられている可能性 |
Q-Qプロットは p 値だけでは得られない診断情報を提供します。例えば、非正規性が歪み、厚い裾、外れ値、または分布の混合のいずれによって引き起こされているかを明らかにできます。この情報は問題への対処法を決定する際に有用です。
歪度と尖度の指針
歪度と尖度の値は、分布の形状に関する数値的な要約を提供します。計算が簡便で、視覚的・正式な検定を補完できます。
よく使われる経験則
文献にはいくつかの指針が存在します。最も一般的に引用される閾値は以下のとおりです:
| 指標 | 許容範囲 | 出典 | |------|---------|------| | 歪度 | 絶対値が2未満 | West, Finch, & Curran(1995) | | 尖度(超過) | 絶対値が7未満 | West, Finch, & Curran(1995) | | 歪度(より厳格) | 絶対値が1未満 | 実務で一般的に使用 | | 尖度(より厳格) | 絶対値が3未満 | 実務で一般的に使用 |
歪度と尖度をそれぞれの標準誤差で割ってz得点を計算する研究者もいます。.05水準で絶対値が1.96を超えるz得点は有意な非正規性を示唆します。ただし、このアプローチは大標本では過度に敏感になります。
実践的アドバイス
歪度と尖度は、正式な正規性検定と視覚的検査の補完として使用してください。代替とするのではありません。中程度の違反(歪度が約1、尖度が約3)は、中心極限定理のおかげで、サンプルサイズが30を超える場合にはしばしば許容されます。
正規性検定をAPA形式で報告する方法
結果セクションで正規性の評価を報告することは、透明性を高め、方法論的な厳密さを示します。以下は、2つの主要な正規性検定をAPA形式でフォーマットする方法です。
Shapiro-Wilk検定の報告
Shapiro-Wilk検定は、試験得点が正規分布していることを示しました、W(25) = .964、p = .498。
Shapiro-Wilk検定は、反応時間に正規性からの有意な逸脱を明らかにしました、W(42) = .871、p = .005。
Kolmogorov-Smirnov検定の報告
Lilliefors修正付きKolmogorov-Smirnov検定は、不安得点の分布が正規分布から有意に異ならないことを示しました、D(150) = .054、p = .200。
Kolmogorov-Smirnov検定は、収入データに有意な非正規性を示しました、D(500) = .112、p < .001。
完全な報告例
方法セクションまたは結果セクションでは、以下のように記述できます:
主分析に先立ち、従属変数の正規性をShapiro-Wilk検定とQ-Qプロットの視覚的検査により評価しました。統制群、W(28) = .957、p = .302、および実験群、W(30) = .971、p = .563 のいずれにおいても、試験得点は正規分布していました。歪度の値は許容範囲内でした(統制群:-0.34;実験群:0.21)。したがって、対応のないt検定を実施しました。
使用した正規性検定、サンプルサイズ、検定結果を常に明記してください。査読者はこの水準の詳細を期待しています。
データが正規でない場合の対処法
非正規性を検出することは最初のステップに過ぎません。それに対処する戦略が必要です。主に3つのアプローチがあります。
選択肢1:データを変換する
データ変換により、歪んだ分布を正規化できる場合があります。一般的な変換には以下があります:
- 対数変換 -- 右に歪んだデータ(例:反応時間、収入)に効果的。
- 平方根変換 -- 中程度に右に歪んだカウントデータに有用。
- Box-Cox変換 -- 最適な正規化変換を見つけるべき乗変換の族。
変換後、変換された変数に対して正規性検定を再実行してください。変換が成功すれば、変換されたデータでパラメトリック検定を分析できます。ただし、結果は変換されたスケール上にあるため、解釈の直感性が低下します。
選択肢2:ノンパラメトリック代替手法を使用する
変換が効果的でない場合や適切でない場合は、正規性を仮定しないノンパラメトリック検定に切り替えてください:
| パラメトリック検定 | ノンパラメトリック代替 | |-----------------|-------------------| | 対応のないt検定 | Mann-Whitney U検定 | | 対応のあるt検定 | Wilcoxon符号順位検定 | | 一元配置分散分析 | Kruskal-Wallis H検定 | | 反復測定分散分析 | Friedman検定 |
ノンパラメトリック検定は生の値ではなく順位を使用するため、分布の仮定の侵害に対してロバストです。トレードオフとして、正規性の仮定が実際に成り立つ場合に統計的検出力がわずかに低下します。
選択肢3:パラメトリック検定を続行する(大標本の場合)
中心極限定理は、十分に大きなサンプルでは、母集団の分布に関係なく、平均値の標本分布が正規性に近づくことを述べています。一般的な指針として:
- 群あたり n > 30 の場合、中程度の非正規性は通常許容されます。
- 群あたり n > 50 の場合、パラメトリック検定はほとんどの正規性からの逸脱に対してロバストです。
- 非常に大きなサンプル(n > 100)の場合、正規性検定は結果に実質的な影響を与えない些末な逸脱により棄却されることがあります。
非正規性にもかかわらず続行する場合は、論文中でこの点に言及し、感度分析としてパラメトリックとノンパラメトリックの両方の結果を報告することを検討してください。
よくある間違い
有意性検定のみに頼る
Shapiro-Wilkの p 値は、正規性からの逸脱が統計的に有意かどうかを教えてくれますが、逸脱がどの程度深刻かは教えてくれません。大標本では、些末で無視してよい逸脱でも有意な結果を生じます。正式な検定は常にヒストグラムとQ-Qプロットの視覚的検査と組み合わせてください。
Shapiro-Wilkがより適切な場合にK-Sを使用する
Kolmogorov-Smirnov検定は、小〜中程度のサンプルにおいてShapiro-Wilk検定よりも検出力が低くなります。サンプルサイズが2,000未満で両方の検定が利用可能な場合は、Shapiro-Wilkを選択してください。Shapiro-Wilkが利用可能であるにもかかわらず、30名のサンプルに対してK-Sを報告すると、検定選択について査読者から懸念が生じる可能性があります。
「正規性を棄却しない」ことと「データが正規である」ことを混同する
有意でないShapiro-Wilkの結果(p > .05)は、正規性に対する証拠が見つからなかったことを意味します。データが正規分布していることの証明ではありません。この区別は、検定が正規性からの逸脱を検出する検出力が限られている小標本で特に重要です。
使用した検定を報告しない
使用した検定、サンプルサイズ、結果を明記せずに単に「データは正規分布していた」と書くのは不十分です。査読者と読者は、自ら証拠を評価する必要があります。常に検定名、検定統計量、サンプルサイズ、p 値を報告してください。
StatMateで正規性を確認する
StatMateは、t検定、分散分析、その他のパラメトリック計算機にShapiro-Wilk正規性チェックを組み込んでいます。データを入力すると、StatMateは自動的に正規性の仮定チェックを実行し、各群の W 統計量と p 値を表示します。
正規性の仮定が侵害された場合、StatMateは適切なノンパラメトリック代替手法を推奨し、対応する計算機への直接リンクを提供します。例えば、対応のないt検定を実行してShapiro-Wilk検定が有意であった場合、StatMateはMann-Whitney U検定への切り替えを提案します。
すべての正規性検定の結果は、APA形式の出力、PDFエクスポート、Wordエクスポートに含まれているため、論文に直接貼り付けることができます。statmate.orgの無料t検定計算機または分散分析計算機で、仮定チェックの実際の動作をお確かめください。