ロジスティック回帰の報告が難しい理由
ロジスティック回帰は、健康科学、心理学、教育研究で最も広く使用されている統計手法の一つです。単一の検定統計量と効果量を報告するt検定や分散分析とは異なり、ロジスティック回帰は複雑な出力の配列を生成し、それを一貫した記述にまとめる必要があります。
完全なロジスティック回帰の記述には、全体的なモデル適合度統計量、擬似R二乗値、分類精度、そして B 係数、標準誤差、Wald統計量、p 値、オッズ比、信頼区間を含む個々の予測変数の統計量が必要です。これらの要素のいずれか一つでも欠落していると、学術誌の査読者から修正を求められる一般的な理由となります。
このガイドでは、あなたの原稿に合わせて使用できるAPA第7版の具体的な例とともに、すべての構成要素をステップバイステップで解説します。
報告すべき主要な統計量
報告テンプレートに入る前に、ロジスティック回帰の記述に含めるべき統計量の概要を示します。
全体的なモデル適合度:
- オムニバスカイ二乗検定(モデルカイ二乗)
- 自由度と p 値
- 擬似R二乗値:Nagelkerkeの R² と Cox & Snellの R²
分類性能:
- 全体的な分類精度(正答率)
- 感度(真陽性率)と特異度(真陰性率)
個々の予測変数:
- B(非標準化ロジスティック回帰係数)
- SE(B の標準誤差)
- Waldカイ二乗統計量
- p 値
- OR(オッズ比、SPSSの出力ではExp(B)と表記)
- オッズ比の95% CI
これらはそれぞれ異なる役割を果たします。モデル適合度統計量は、予測変数の集合が2つの結果群を全体として区別するかどうかを読者に伝えます。分類表はモデルが実際にどの程度うまく機能するかを示します。個々の予測変数の統計量は、どの変数が予測を駆動し、どの程度の影響があるかを明らかにします。
ステップ1:全体的なモデル適合度の報告
モデル係数のオムニバス検定は、予測変数を含む完全モデルが、切片のみのヌルモデルよりも有意に適合するかどうかを評価します。これはカイ二乗検定として報告されます。
APAテンプレート:
[結果変数]に対する[予測変数]の効果を検討するために、二値ロジスティック回帰を実施しました。全体モデルは統計的に有意でした、カイ二乗(df) = X.XX、p = .XXX。これは予測変数の集合が[群1]と[群2]を確実に区別したことを示しています。モデルは[結果変数]の分散のXX.X%(Nagelkerkeの R²)を説明しました。
例:
GPA、週あたりの学習時間、授業出席率が卒業状況に及ぼす影響を検討するために、二値ロジスティック回帰を実施しました。全体モデルは統計的に有意でした、カイ二乗(3) = 34.72、p < .001。これは予測変数の集合が、卒業した学生としなかった学生を確実に区別したことを示しています。モデルは卒業状況の分散の31.5%(Nagelkerkeの R²)を説明しました。
擬似R二乗の理解
通常の最小二乗回帰とは異なり、ロジスティック回帰は真の R² 値を生成しません。代わりに、説明された分散の割合を近似する擬似R二乗の指標を提供します。
| 指標 | 範囲 | 備考 | |------|------|------| | Cox & Snellの R² | 0 〜 < 1 | 1.0に到達できない;過小評価の傾向あり | | Nagelkerkeの R² | 0 〜 1 | Cox & Snellの調整版;報告に推奨 |
ほとんどのAPA形式の論文では、上限が1.0であるためより解釈しやすいNagelkerkeの R² が報告されます。透明性のために両方の値を報告する研究者もいます。どちらのアプローチも認められていますが、使用している擬似R二乗がどの種類であるかを常にラベル付けしてください。
ステップ2:分類表の報告
分類表は、モデルが正しい結果群にケースをどの程度正確に割り当てるかを要約します。これは統計的有意性検定を補完する実用的なモデル性能の指標です。
APAテンプレート:
モデルは全体でXX.X%のケースを正しく分類し、感度XX.X%([陽性結果]を正しく予測)、特異度XX.X%([陰性結果]を正しく予測)でした。
例:
モデルは全体で78.3%のケースを正しく分類し、感度82.1%(卒業を正しく予測)、特異度71.4%(非卒業を正しく予測)でした。
分類表の形式
| 観測値 | 予測:非卒業 | 予測:卒業 | 正答率 | |--------|------------|----------|--------| | 非卒業 | 45 | 18 | 71.4% | | 卒業 | 15 | 69 | 82.1% | | 全体 | | | 78.3% |
分類精度を解釈する際には、基準率を考慮してください。サンプルの70%の学生が卒業した場合、全員が卒業すると単純に予測するモデルは、予測変数なしで70%の精度を達成します。モデルの精度はこのベースラインに対して評価すべきです。
ステップ3:個々の予測変数の報告
個々の予測変数の結果は、表で提示した後に記述的な説明を添えるのが最善です。ロジスティック回帰のAPA形式の表には、B、SE、Waldカイ二乗、p、オッズ比(OR)、オッズ比の95%信頼区間の列が含まれます。
ロジスティック回帰係数表
| 予測変数 | B | SE | Wald カイ二乗 | p | OR | ORの95% CI | |---------|------|------|------------|------|------|-----------| | (定数) | -8.42 | 2.15 | 15.33 | < .001 | -- | -- | | GPA | 1.63 | 0.52 | 9.82 | .002 | 5.10 | [1.84, 14.15] | | 学習時間 | 0.18 | 0.07 | 6.61 | .010 | 1.20 | [1.04, 1.37] | | 出席率(%) | 0.04 | 0.02 | 4.00 | .045 | 1.04 | [1.00, 1.08] |
個々の予測変数の記述
GPAは卒業状況の有意な予測変数でした、B = 1.63、SE = 0.52、Wald カイ二乗(1) = 9.82、p = .002、OR = 5.10、95% CI [1.84, 14.15]。GPAが1ポイント上がるごとに、卒業のオッズは約5.10倍に増加しました。週あたりの学習時間も卒業を有意に予測しました、B = 0.18、SE = 0.07、Wald カイ二乗(1) = 6.61、p = .010、OR = 1.20、95% CI [1.04, 1.37]。週あたりの学習時間が1時間増加するごとに、卒業のオッズが20%増加することが示されました。授業出席率は限界的に有意な予測変数でした、B = 0.04、SE = 0.02、Wald カイ二乗(1) = 4.00、p = .045、OR = 1.04、95% CI [1.00, 1.08]。
Waldカイ二乗は各個別の予測変数に対して1自由度を持つことに注意してください(予測変数がダミーコーディングされた多カテゴリ変数でない場合)。自由度は常に括弧内に含めてください。
オッズ比の解釈
オッズ比(OR)は、ロジスティック回帰における主要な効果量の指標です。他のすべての予測変数を一定に保った場合に、予測変数が1単位増加したときに結果のオッズがどのように変化するかを示します。
オッズ比の参照ガイド
| ORの値 | 解釈 | |--------|------| | OR = 1.00 | 効果なし;予測変数はオッズを変化させない | | OR > 1.00 | 結果のオッズが増加 | | OR < 1.00 | 結果のオッズが減少 |
具体例: OR = 2.45 は、予測変数が1単位増加すると、結果が生じるオッズが2.45倍(145%高い)になることを意味します。OR = 0.60 は、1単位増加するとオッズが40%減少する(1 - 0.60 = 0.40 として計算)ことを意味します。
連続変数とカテゴリ変数
連続変数の場合、ORは元の測定尺度での1単位の変化を反映します。学習時間が週あたりの時間で測定されている場合、OR = 1.20 は1時間追加するごとにオッズが20%増加することを意味します。単位に注意してください。変数が分単位で測定されていた場合、1単位あたりのORは非常に小さくなり、解釈が難しくなります。1単位あたりのORが1.00に非常に近い場合は、連続変数の再スケーリング(例:10時間あたりの増加)を検討してください。
カテゴリ変数(ダミーコーディング)の場合、ORはコーディングされた群と参照群における結果のオッズを比較します。処置群(コード1)と統制群(コード0)のOR = 3.20 は、処置群の結果のオッズが統制群の3.20倍であることを意味します。
重要な区別:オッズは確率ではない
よくある誤りは、オッズ比を確率の比として解釈することです。「処置群の患者は回復する可能性が3.20倍高かった」という表現は厳密には不正確です。正しい言い方は「処置群では回復のオッズが3.20倍大きかった」です。結果がまれな場合(有病率10%未満)、オッズ比はリスク比に近似しますが、一般的な結果の場合、両者は大きく乖離します。
完全なAPA報告例
以下は、前のセクションのすべての要素を組み合わせた完全な記述です。この例では、3つの予測変数を用いた卒業予測のシナリオを使用しています。
147名の学部生を対象に、GPA、週あたりの学習時間、授業出席率から卒業状況(卒業 vs. 非卒業)を予測するために二値ロジスティック回帰を実施しました。全体モデルは統計的に有意でした、カイ二乗(3) = 34.72、p < .001、Nagelkerkeの R² = .32。これは予測変数の集合が卒業した学生としなかった学生を確実に区別したことを示しています。モデルは78.3%のケースを正しく分類し、感度82.1%、特異度71.4%でした。
GPAが卒業の最も強い予測変数でした、B = 1.63、SE = 0.52、Wald カイ二乗(1) = 9.82、p = .002、OR = 5.10、95% CI [1.84, 14.15]。GPAが1ポイント上がるごとに、卒業のオッズは約5倍に増加しました。週あたりの学習時間も卒業を有意に予測し、B = 0.18、SE = 0.07、Wald カイ二乗(1) = 6.61、p = .010、OR = 1.20、95% CI [1.04, 1.37]、1時間追加するごとにオッズが20%増加しました。授業出席率はより小さいが統計的に有意な寄与を示しました、B = 0.04、SE = 0.02、Wald カイ二乗(1) = 4.00、p = .045、OR = 1.04、95% CI [1.00, 1.08]。
この例は明確な構造に従っています:分析とサンプルを述べ、全体的なモデル適合度と分類精度を報告し、次に各予測変数の完全な統計量セットを記述します。査読者は必要な情報をすべてすぐに見つけることができます。
避けるべきよくある間違い
オッズ比なしにB係数を報告する
ロジスティック回帰の B 係数は対数オッズの値であり、直感的に解釈できません。常に B をオッズ比(OR = e^B)に変換し、両方を報告してください。オッズ比は読者と査読者が期待する効果量です。
オッズ比の信頼区間を省略する
ORの95%信頼区間は不可欠です。オッズ比推定値の精度を伝え、効果が些末に小さい可能性があるか実質的に大きい可能性があるかを明らかにします。95% CI [0.85, 7.35] のOR = 2.50 は1.00をまたいでおり統計的に有意ではありませんが、CI [1.40, 4.46] のOR = 2.50 ははるかに強い証拠を提供します。
オッズ比を確率と混同する
上述のとおり、オッズと確率は数学的に異なります。OR = 3.00 は結果が「3倍起こりやすい」ことを意味しません。オッズが3倍大きいことを意味します。この区別は、結果の有病率が高い場合に特に重要です。
モデル適合度統計量を報告しない
一部の研究者は、オムニバスモデル検定、Nagelkerkeの R²、分類精度を報告せずに、いきなり個々の予測変数に移ります。これらがないと、読者は個々の効果を検討する前に全体的なモデルが意味のあるものかどうかを評価できません。
擬似R二乗ではなくR二乗を使用する
ロジスティック回帰は従来の R² 値を生成しません。Nagelkerkeの R²(またはCox & Snellの R²)であることを明示せずに R² = .32 と報告するのは誤解を招きます。報告している擬似R二乗の種類を常にラベル付けしてください。
Hosmer-Lemeshow検定を無視する
Hosmer-Lemeshow適合度検定は、モデルがデータに十分に適合しているかを評価します。有意でない結果(p > .05)は適切な適合を示します。常に必須というわけではありませんが、この検定を報告することで、特にモデルの較正について査読者が懸念を持つ場合に、記述が強化されます。
ロジスティック回帰APAチェックリスト
原稿を提出する前に、ロジスティック回帰の結果に以下が含まれていることを確認してください:
- 実施したロジスティック回帰の種類(二値、多項、順序)
- サンプルサイズと結果群の度数
- 自由度と p 値を含む全体モデルのカイ二乗
- 明確にラベル付けされた擬似R二乗(Nagelkerkeの R² を推奨)
- 分類精度(全体の正答率、感度、特異度)
- B、SE、Wald カイ二乗、p、OR、ORの95% CI を含む係数表
- 係数表の切片(定数)行
- 有意な予測変数のオッズ比の叙述的解釈
- オッズ比が正しく解釈されている(確率としてではない)
- すべての統計記号がイタリック体(B、SE、p、カイ二乗、R²)
- 正確な p 値(非常に小さい値には p < .001)
- 仮定チェックへの言及(ロジットの線形性、多重共線性、外れ値)
StatMateの無料ロジスティック回帰計算機をお試しください
SPSSやRの出力からこれらすべての統計量を集め、正しくフォーマットするのは時間がかかり、エラーが起きやすい作業です。StatMateのロジスティック回帰計算機は、全プロセスを自動で処理します。
二値の結果変数と予測変数を入力すると、StatMateはオムニバスモデル検定、Nagelkerkeの R²、分類表、そして B、SE、Waldカイ二乗、p、オッズ比、95%信頼区間を含む個々の予測変数の統計量を計算します。結果はAPA第7版の形式でフォーマットされ、原稿に直接コピーできる状態です。
計算機はまた、各予測変数のORをその信頼区間とともに視覚的に表示するオッズ比フォレストプロットも生成します。どの予測変数が最も強い効果を持ち、信頼区間が1.00をまたいでいるかを簡単に識別できます。ワンクリックで完全な結果をWordにエクスポートできます。
StatMateに計算とフォーマットを任せることで、信頼区間の欠落、ラベルのない擬似R二乗値、誤って計算されたオッズ比などの一般的なエラーを排除し、知見の解釈に時間を集中させることができます。