回帰分析の正しい報告が重要な理由
回帰分析は、量的研究で最も汎用性が高く広く使用される手法の一つです。学習時間から試験成績を予測する場合でも、複数の職場要因が職務満足度に与える複合的な影響をモデル化する場合でも、人口統計学的変数を統制した上で臨床介入が症状軽減を予測するかどうかを検証する場合でも、回帰分析がその枠組みを提供します。しかし、APA形式での回帰結果の報告は、他のほぼすべての統計手法よりも研究者を悩ませます。
困難さは回帰出力の階層的な性質に起因します。1つの検定統計量と効果量を産出するt検定とは異なり、回帰分析はモデル全体の適合度統計量、個々の予測変数の統計量、標準化および非標準化係数、信頼区間、仮定の診断を産出します。本ガイドでは、APA第7版の形式で単回帰と重回帰の両方を、具体的な数値例とともに解説します。
回帰結果のAPA形式
単回帰テンプレート
APAで報告するすべての単回帰結果には以下を含める必要があります:
- R二乗(R²):説明された分散の割合
- F統計量:自由度付きの全体モデル検定
- 正確な p 値:小数点以下3桁または p < .001
- 非標準化係数(B):標準誤差付きの傾き
- 標準化係数(β):研究間比較用
- 95%信頼区間 B について
一般テンプレート:
A simple linear regression was conducted to examine whether [予測変数] predicted [結果変数]. The model was statistically significant, R² = .XX, F(1, N-2) = X.XX, p = .XXX. [予測変数] significantly predicted [結果変数], B = X.XX, SE = X.XX, β = .XX, t(df) = X.XX, p = .XXX, 95% CI [X.XX, X.XX].
重回帰テンプレート
重回帰では2つの追加要件があります:
- 調整済み R²:予測変数の数に対する補正
- 係数表:2つ以上の予測変数がある場合
ステップバイステップの例:学習時間からGPAを予測
研究シナリオ
教育心理学者が、週間学習時間が120名の大学生の学期GPAを予測するかどうかを調査します。
モデル全体の報告
単回帰分析を実施し、週間学習時間が学期GPAを予測するかどうかを検討した。結果は全体モデルが統計的に有意であることを示した, R² = .34, F(1, 118) = 60.73, p < .001。週間学習時間は学期GPAの分散の34%を説明した。
係数の報告
週間学習時間は学期GPAを有意に予測した, B = 0.08, SE = 0.01, β = .58, t(118) = 7.79, p < .001, 95% CI [0.06, 0.10]。週あたりの学習時間が1時間追加されるごとに、学期GPAは平均0.08ポイント上昇した。
各要素の内訳
| 要素 | 値 | 説明 | |------|------|------| | R² | .34 | 説明された分散34%;先頭ゼロなし | | F | 60.73 | モデル全体のF統計量、小数点以下2桁 | | df | 1, 118 | 回帰df(予測変数数)と残差df(N - k - 1) | | p | < .001 | 正確なp値、非常に小さい場合は < .001 | | B | 0.08 | 元の単位での非標準化傾き | | SE | 0.01 | 傾きの標準誤差 | | β | .58 | 標準化係数(先頭ゼロなし) | | t | 7.79 | 係数のt統計量 | | 95% CI | [0.06, 0.10] | B の信頼区間 |
R二乗の解釈
R² は、予測変数(群)が結果変数の分散のうち説明する割合を表します。
R²の解釈ガイドライン
Cohen(1988)が行動科学の基準を提供しました:
| R² | f² | 解釈 | |------|------|------| | .02 | .02 | 小さい効果 | | .13 | .15 | 中程度の効果 | | .26 | .35 | 大きい効果 |
R² vs 調整済みR²
1つの予測変数の単回帰では R² で十分です。重回帰では常に R² と調整済み R² の両方を報告してください。
調整済み R² は不必要な変数の追加にペナルティを課します。予測変数を追加して調整済み R² が低下した場合、その予測変数は既存の予測変数で説明されるものを超えて寄与していません。
ベータ係数:標準化と非標準化
非標準化係数(B)
B は、予測変数の1単位の変化あたりの結果変数の予測される変化を元の測定単位で示します:
週当たりの学習時間が1時間追加されるごとに、GPAは0.08ポイント上昇した(B = 0.08)。
標準化係数(β)
β は標準偏差単位での予測される変化を表し、異なる尺度で測定された予測変数間の直接比較を可能にします:
学習時間はより強い相対的寄与をした(β = .38)。出席率よりも(β = .22)。
APA形式での両方の報告
Study hours significantly predicted exam scores, B = 1.92, SE = 0.31, β = .38, t(146) = 6.19, p < .001, 95% CI [1.31, 2.53].
重回帰:完全な計算例
研究シナリオ
研究者が、学習時間、授業出席率、既存のGPAが150名の学生の期末試験成績を予測するかどうかを調査します。
モデル全体
重回帰分析を実施し、学習時間、授業出席率、既存のGPAが期末試験成績を予測するかどうかを検討した。全体モデルは統計的に有意であった, R² = .52, 調整済み R² = .51, F(3, 146) = 52.78, p < .001。3つの予測変数は期末試験成績の分散の52%を説明した。
係数表
| 予測変数 | B | SE | β | t | p | 95% CI | |---------|------|------|------|------|------|---------| | (切片) | 12.45 | 5.32 | -- | 2.34 | .021 | [1.94, 22.96] | | 学習時間 | 1.92 | 0.31 | .38 | 6.19 | < .001 | [1.31, 2.53] | | 出席率 | 0.28 | 0.08 | .22 | 3.50 | < .001 | [0.12, 0.44] | | 既存のGPA | 8.74 | 1.85 | .29 | 4.72 | < .001 | [5.08, 12.40] |
注. R² = .52, 調整済み R² = .51, F(3, 146) = 52.78, p < .001.
個々の予測変数の記述
学習時間が期末試験成績の最も強い予測変数であった, B = 1.92, SE = 0.31, β = .38, t(146) = 6.19, p < .001, 95% CI [1.31, 2.53]。既存のGPAも有意に試験成績を予測した, B = 8.74, SE = 1.85, β = .29, t(146) = 4.72, p < .001, 95% CI [5.08, 12.40]。授業出席率はより小さいが統計的に有意な寄与をした, B = 0.28, SE = 0.08, β = .22, t(146) = 3.50, p < .001, 95% CI [0.12, 0.44]。
階層的(R²変化量)報告
ブロック単位でモデルを構築する場合、追加で説明される分散を示すために ΔR² を報告してください:
ステップ1では学習時間を投入し、分散の28%を説明した, R² = .28, F(1, 148) = 57.56, p < .001。ステップ2では出席率と既存のGPAを追加した。モデルは追加で24%の分散を説明した, ΔR² = .24, F-変化量(2, 146) = 36.52, p < .001。
回帰の仮定の報告
APA第7版は、少なくとも仮定チェックへの簡潔な言及を期待しています。
1. 線形性
各予測変数と結果変数の散布図はほぼ線形の関係を示した。
2. 残差の独立性
Durbin-Watson統計量は1.92であり、残差間の実質的な自己相関がないことを示した。
3. 等分散性
標準化残差と予測値のプロットはランダムな散布パターンを示し、等分散性の仮定が満たされていることを示唆した。
4. 残差の正規性
標準化残差のQ-Qプロットはほぼ正規分布を示した。残差のShapiro-Wilk検定は非有意であった(W = 0.99, p = .312)。
5. 多重共線性(重回帰のみ)
すべての予測変数のVIF値は1.12から2.34の範囲であり、閾値10を十分に下回り、多重共線性の問題がないことを示した。
モデル比較のAPA形式
ネストされたモデルを比較する場合、F-変化量検定を報告してください:
モデル1には人口統計学的統制変数を含め、分散の15%を説明した(R² = .15)。モデル2には介入変数を追加し、説明される分散が12%増加した(ΔR² = .12), F-変化量(1, 96) = 18.34, p < .001。
非ネストモデルを比較する場合、AICまたはBIC値を報告してください:
モデルA(AIC = 456.2)はモデルB(AIC = 472.8)よりも良好な適合を示し、16.6の差でモデルAが有利であった。
よくある間違いと回避方法
1. 重回帰で調整済みR²を省略する
調整済み R² は複数の予測変数によるモデル適合度の評価に不可欠です。不必要な変数にペナルティを課し、説明される分散のより正直な推定値を提供します。
2. BとBetaを混同する
B(非標準化)は実践的解釈のために元の単位を保持します。β(標準化)は異なる尺度間の予測変数の比較を可能にします。常にどちらを報告しているかをラベル付けし、可能な限り両方を含めてください。
3. p = .000と報告する
決して p = .000 と書かないでください。常に p < .001 と報告してください。
4. 信頼区間の欠如
APA第7版は、すべての回帰係数に95% CIを強く推奨しています。
5. 切片を忘れる
係数表に切片を含めてください(解釈の焦点でなくても)。
6. 仮定チェックを無視する
少なくとも、多重共線性のVIF値と残差プロットを確認したことに言及してください。
7. 他の予測変数を一定に保つことなしにBを解釈する
重回帰では、各 B は他のすべての予測変数を統制した上でのその予測変数の固有の効果を表します。単純な二変量関係として解釈しないでください。
APA回帰チェックリスト
原稿を提出する前に確認してください:
- モデル全体の R²(重回帰では調整済み R² も)
- 正しい自由度付きの F 統計量
- モデル全体の正確な p 値
- 各予測変数の B、SE、β、t、p、95% CIを含む係数表
- 係数表中の切片行
- 非標準化(B)と標準化(β)係数の明確なラベル
- すべての統計記号のイタリック体
- 仮定チェックへの言及(少なくともVIFと残差プロット)
- 階層的モデルの場合:各ステップの ΔR² と F-変化量
よくある質問
R二乗と調整済みR二乗の違いは何ですか?
R² はすべての予測変数で説明される分散の割合を示します。調整済み R² は予測変数の数を補正し、不必要な変数にペナルティを課します。異なる数の予測変数を持つモデルを比較する際に調整済み R² を使用してください。
負の回帰係数をどう解釈しますか?
負の B は、予測変数が1単位増加すると他の予測変数を一定に保った場合に結果が B 単位減少することを意味します。
標準化係数と非標準化係数のどちらを報告すべきですか?
APAは両方を推奨しています。非標準化係数(B)は実践的解釈のために測定単位を保持します。標準化係数(β)は異なる尺度間の予測変数の相対的重要性の比較を可能にします。
VIFが10を超えるとどういう意味ですか?
10を超えるVIFは重度の多重共線性を示します。2つ以上の予測変数が高い相関を持ち、標準誤差を膨張させ、個々の係数検定を不信頼にしています。
回帰はカテゴリカル予測変数にも使用できますか?
はい。ダミー変数(0/1コーディング)を作成することで可能です。k カテゴリの変数には k - 1 個のダミー変数が必要です。
モデルが有意でない場合の回帰結果の報告方法は?
同じ統計量を報告してください:F、自由度、p、R²。例:「モデルは統計的に有意ではなかった, F(2, 97) = 1.45, p = .240, R² = .03。」
StatMateを使用したAPA形式の回帰結果
回帰出力を正しくフォーマットするのは、特に複数の予測変数がある場合に面倒でエラーが発生しやすい作業です。StatMateの単回帰および重回帰計算ツールはプロセスを自動化します。
データを入力すると、StatMateが R²、調整済み R²、F 統計量、標準誤差付きの個別係数、標準化ベータ、t統計量、p値、信頼区間を計算し、すべてをAPA第7版形式でフォーマットします。結果は原稿に直接コピーできます。