3群以上の平均値を比較します。結果にはF統計量、p値、η²(イータ二乗)、Bonferroniの多重比較がAPA形式で含まれます。
分散分析(ANOVA: Analysis of Variance)は、3つ以上の独立した群の平均を 比較し、統計的に有意な差があるかどうかを判断するための基本的な統計手法です。 t検定は一度に2群しか比較できないのに対し、ANOVAは単一の統合的な検定で 複数の群を同時に比較することができ—複数のペアワイズt検定を 実施した場合に増大する第1種の過誤率を効果的に制御します。
この手法は、Sir Ronald A. Fisherが1920年代にイギリスのRothamsted実験 農場で勤務していた際に開発しました。Fisherは作物の収穫量に複数の処理を 適用する農業実験を分析するためにANOVAを開発しました。1925年の著書Statistical Methods for Research WorkersでF分布とF検定を 導入し—これは彼の名にちなんだもので—今日のすべてのANOVAの 数学的基盤として残っています。その後の一世紀にわたり、ANOVAは心理学、 医学、教育学、生物学、マーケティングなど、ほぼすべての実証的研究分野 における主要な分析手法となりました。
ANOVAは根本的に、データの総変動を2つの要素に分割します: 群間分散(群平均間の差異による変動)と 群内分散(各群内の個人差による変動。誤差分散または 残差分散とも呼ばれます)。この2つの分散推定値の比が F統計量を生成します。群間分散が群内分散よりも十分に大きい場合、F値が大きくなり、対応するp値が 小さくなります—これは少なくとも1つの群平均が他の群と有意に 異なることを示します。
一元配置分散分析(単一要因分散分析とも呼ばれます)は、1つの独立変数 (要因)のみがある場合に、3つ以上の独立した群の平均が異なるかを検定します。 例えば、臨床研究者が3種類の薬物治療の疼痛緩和スコアを比較したり、 教育者が4種類の教授法の試験成績を比較したりすることができます。 「一元配置」という名称は、1つのグループ化変数のみを検討することを 示しています。2つ以上の要因(例:薬物の種類と用量)がある 場合は、二元配置または要因分散分析が必要であり、この計算機の範囲外です。
一元配置分散分析は、2つの自由度を持つ単一のF統計量を算出 します:df群間(群数 - 1)と df群内(総標本サイズ - 群数)。有意な F値は、少なくとも1つの群平均が異なることを示しますが、 どの群が互いに異なるかは示しません。それが事後検定の役割です。
総括的ANOVA F検定が統計的に有意である場合、群平均がすべて 等しくないことはわかりますが—具体的にどの群のペアが異なるかを 特定するには事後検定(ラテン語で「この後」の意)が必要です。この 計算機は、最も広く使用され保守的な事後検定法の1つである Bonferroni補正を使用します。Bonferroni法は、 希望する有意水準(通常 .05)をペアワイズ比較の回数で割ることで、 多重比較を行っても全体の族別過誤率が .05未満に維持されるようにします。 3群の場合、3つのペアワイズ比較があるため、各比較は α = .05 / 3 = .0167で評価されます。この保守性は偽陽性を 防止しますが、群が多い場合、TukeyのHSDよりもやや低い検定力を示す ことがあります。
製薬研究者が、2種類の活性薬物とプラセボの疼痛軽減効果(0–100 視覚的アナログスケールで測定)を比較しようとしています。30名の 患者が3群のいずれかに無作為に割り当てられました(n = 各群10名)。
薬物 A (n = 10)
72, 68, 75, 71, 69, 74, 70, 73, 67, 71
M = 71.00, SD = 2.58
薬物 B (n = 10)
65, 60, 63, 62, 67, 64, 61, 66, 63, 59
M = 63.00, SD = 2.62
プラセボ (n = 10)
55, 58, 52, 57, 54, 59, 53, 56, 51, 55
M = 55.00, SD = 2.62
分散分析要約表
| 変動因 | SS | df | MS | F | p |
|---|---|---|---|---|---|
| 群間 | 1280.00 | 2 | 640.00 | 93.18 | < .001 |
| 群内 | 185.40 | 27 | 6.87 |
結果
F(2, 27) = 93.18, p < .001, η² = .87
効果量(η² = .87)は非常に大きく、疼痛スコアの 総分散の約87%が群の所属によって説明されることを示しています。
Bonferroni事後検定比較
| 比較 | 平均差 | p(補正後) | 有意? |
|---|---|---|---|
| 薬物 A vs. 薬物 B | 8.00 | < .001 | はい |
| 薬物 A vs. プラセボ | 16.00 | < .001 | はい |
| 薬物 B vs. プラセボ | 8.00 | < .001 | はい |
Bonferroni補正後、3つのペアワイズ比較すべてが統計的に有意でした。 薬物Aが最も高い疼痛軽減を示し、次いで薬物B、プラセボ群が最も少ない 改善を報告しました。
適切な統計検定の選択は、群数、データの性質、測定が独立かまたは反復かに よって異なります。以下の表は、最も一般的な状況と各状況に推奨される検定を まとめたものです。
| 状況 | 群数 | 推奨される検定 | 備考 |
|---|---|---|---|
| 2つの独立した群の平均比較 | 2 | 独立標本t検定 | Welchのt検定をデフォルトとして推奨 |
| 3つ以上の独立した群の平均比較 | 3+ | 一元配置分散分析 | 有意な場合は事後検定で追跡分析 |
| 非正規データ、3つ以上の独立群 | 3+ | Kruskal-Wallis H検定 | 一元配置ANOVAのノンパラメトリック代替法 |
| 同一被験者で3つ以上の条件を測定 | 3+ | 反復測定分散分析 | 被験者内の相関を考慮 |
| 非正規の反復測定、3つ以上の条件 | 3+ | Friedman検定 | 反復測定ANOVAのノンパラメトリック代替法 |
| 2つ以上の要因を同時に分析 | 多様 | 二元配置 / 要因分散分析 | 主効果と交互作用の検定 |
よくある間違いは、3つ以上の群がある場合にANOVAの代わりに複数のt検定を 実施することです。3群の場合、各 α = .05 で3つのペアワイズt検定が 必要となります。少なくとも1つの偽陽性が生じる確率は約 1 − (1 − .05)3 = .14で、意図した過誤率の 約3倍です。ANOVAは、すべての群を単一の総括検定で検証することでこの 問題を回避します。
ANOVAの結果を解釈する前に、以下の4つの前提条件が合理的に満たされて いるかを確認する必要があります。これらの前提条件に違反すると、不正確なp値と信頼できない結論につながる可能性があります。
1. 観測の独立性
各観測は他のすべての観測と独立でなければなりません。これは、ある 参加者のスコアが他の参加者のスコアに影響を与えてはならないことを 意味します。独立性は、適切な実験デザイン—群への無作為割り当て および参加者のクラスタリングやネスティングの排除—によって 保証されます。違反は教室研究(同じクラスの学生は独立でない)や 縦断的デザインで一般的です。観測が独立でない場合は、混合効果モデルや 反復測定分散分析を検討してください。
2. 正規性
従属変数は各群内でおおよそ正規分布に従う必要があります。ヒストグラムや Q-Qプロットを用いて視覚的に、またはShapiro-Wilk検定を用いて正式に 正規性を評価できます。ただし、ANOVAは中心極限定理のおかげで、標本 サイズが中程度以上(おおよそ各群 n ≥ 20)の場合、正規性 の違反に対して非常に頑健です。小標本かつ強く歪んだデータの場合は、 ノンパラメトリックな代替法であるKruskal-Wallis H検定を使用してください。
3. 等分散性(分散の均一性)
従属変数の分散はすべての群でおおよそ等しい必要があります。この仮定はLevene検定を用いて検証します:非有意なLevene検定 (p > .05)は、分散が十分に均一であることを示唆します。 経験則として、群サイズが等しい場合、ANOVAは不均等な分散に対して 頑健です。群サイズが不均等でLevene検定が有意な場合は、等分散を仮定 しないWelchのANOVAやBrown-Forsythe検定を代替として 検討してください。
4. 間隔尺度または比率尺度
従属変数は連続型尺度(間隔尺度または比率尺度)で測定されている必要が あります。ANOVAは平均と分散の計算に依存しており、これは連続型データ でのみ意味を持ちます。従属変数が順序型(例:順位やリッカート尺度の 項目)の場合は、Kruskal-Wallis検定を使用してください。結果が カテゴリ型(例:合格/不合格)の場合は、カイ二乗検定を使用してください。
p値は群間差が統計的に有意かどうかを示す一方、 イータ二乗(η²)は実用的な観点から その差がどの程度大きいかを示します。イータ二乗は、従属変数の総分散のうち 群の所属によって説明される割合を表します。計算式は η² = SS群間 / SS総です。 例えば、η² = .14は、スコアの変動性の14%がグループ化 変数に起因することを意味します。
効果量の報告は不可欠です。十分に大きな標本では、些細な小さな差でも 有意なp値を生み出す可能性があるためです。Cohen(1988)は η²の解釈のために以下の広く使用される基準を 提示しました:
| η² の値 | 解釈 | 実用的意味 |
|---|---|---|
| 0.01 | 小さい効果 | 約1%の分散説明;群間差はわずか |
| 0.06 | 中程度の効果 | 約6%の分散説明;意味のある顕著な差 |
| 0.14 | 大きい効果 | 約14%以上の分散説明;実質的で重要な差 |
注意:一部の研究者は、特に複雑な要因デザインにおいて、バイアスの少ない 代替指標として偏イータ二乗(ηp²)や オメガ二乗(ω²)を好みます。 単一要因の一元配置分散分析では、イータ二乗と偏イータ二乗は同一です。 オメガ二乗はやや保守的な推定値を提供し、一部の学術誌で好まれています。
APA第7版のガイドラインによると、ANOVAの結果にはF統計量、 2つの自由度、p値、効果量の指標を含める必要があります。各群の 記述統計量(平均と標準偏差)も報告すべきです。以下は計算例を含む テンプレートです:
総括F検定(一元配置分散分析)
一元配置分散分析の結果、3つの治療条件間で疼痛軽減スコアに統計的に 有意な差が認められた、F(2, 27) = 93.18, p < .001, η² = .87。薬物A(M = 71.00, SD = 2.58)が薬物B(M = 63.00, SD = 2.62)およびプラセボ(M = 55.00, SD = 2.62) よりも有意に高いスコアを示した。
事後検定比較(Bonferroni)
Bonferroni補正事後検定の結果、薬物A(M = 71.00, SD = 2.58)が薬物B(M = 63.00, SD = 2.62)よりも有意に大きな疼痛軽減を示し、p < .001, 平均差 = 8.00, 95% CI [5.26, 10.74]、プラセボ(M = 55.00, SD = 2.62)よりも有意に大きな疼痛軽減を示した、p < .001, 平均差 = 16.00, 95% CI [13.26, 18.74]。 薬物Bもプラセボよりも有意に高いスコアを示した、p < .001, 平均差 = 8.00, 95% CI [5.26, 10.74]。
注意:F値は小数点以下2桁まで報告します。p値は小数点 以下3桁まで報告し、.001未満の場合は p < .001と表記します。 統計記号(F, p, M, SD, η²)は常にイタリック体で表記します。.001未満の場合を 除き、可能な限り正確なp値(例:p = .034)を不等号 (例:p < .05)の代わりに報告してください。
StatMateの一元配置分散分析の計算は、Rの aov()および summary()関数、 ならびにSPSS GLM出力に対して検証されています。F分布に jstatライブラリを使用し、プールされた群内分散を用いたBonferroni補正 ペアワイズ比較を計算します。すべてのF統計量、p値、 イータ二乗値、事後検定結果は、RおよびSPSSの出力と小数点以下4桁以上で 一致します。自由度は標準的な公式を使用して計算します: df群間 = k − 1, df群内 = N − k、 ここでkは群数、Nは総標本サイズです。
t検定
2群の平均値を比較
カイ二乗検定
カテゴリ変数の関連を検定
相関分析
関係の強さを測定
記述統計
データを要約
サンプルサイズ
検出力分析・標本計画
1標本t検定
既知の値との比較
マン・ホイットニーU
ノンパラメトリック群間比較
ウィルコクソン検定
ノンパラメトリック対応検定
回帰分析
X-Yの関係をモデル化
重回帰分析
複数の予測変数
クロンバックのα
尺度の信頼性
ロジスティック回帰
二値アウトカムの予測
因子分析
潜在因子構造の探索
クラスカル・ウォリス
ノンパラメトリック3群以上比較
反復測定
被験者内分散分析
二元配置分散分析
要因計画の分析
フリードマン検定
ノンパラメトリック反復測定
フィッシャーの正確検定
2×2表の正確検定
マクネマー検定
対応のある名義データの検定
Excel/スプレッドシートから貼り付け、またはCSVファイルをドロップ
Excel/スプレッドシートから貼り付け、またはCSVファイルをドロップ
Excel/スプレッドシートから貼り付け、またはCSVファイルをドロップ
データを入力して「計算」をクリックしてください
または「サンプルデータを読み込む」をクリックしてお試しください