What is the difference between binary, multinomial, and ordinal logistic regression?

Binary logistic regression predicts a dichotomous outcome (two categories). Multinomial logistic regression predicts an outcome with three or more unordered categories (e.g., preferred transportation: car, bus, bicycle). Ordinal logistic regression predicts an outcome with ordered categories (e.g., disease severity: mild, moderate, severe). Each type produces odds ratios, but the interpretation and model structure differ.

How do I interpret an odds ratio less than 1?

An OR less than 1.00 indicates decreased odds of the outcome. Calculate (1 - OR) x 100 for the percentage decrease. For example, OR = 0.65 means a 35% decrease in odds per one-unit increase in the predictor. Some researchers report the reciprocal (1/OR) to express the protective effect as increased odds.

What is the minimum sample size for logistic regression?

The classic guideline is at least 10 events per predictor variable (EPV), where events are cases in the less frequent outcome category. More recent research recommends EPV of 20 or higher for stable estimates. For 5 predictors with a 30% event rate, you need at least 50 events (total N of approximately 167).

What is the Hosmer-Lemeshow test and when should I report it?

The Hosmer-Lemeshow test evaluates whether predicted probabilities match observed outcomes across subgroups. A non-significant result (p > .05) indicates adequate model fit. Report it to strengthen your write-up, but note it is sensitive to sample size: large samples may flag trivial deviations, while small samples may miss genuine lack of fit.

What is the difference between the Wald test and the likelihood ratio test?

The Wald test evaluates individual predictor coefficients using the coefficient-to-standard-error ratio. The likelihood ratio test compares nested models by examining the change in -2 log likelihood. The likelihood ratio test is generally more reliable, especially for large coefficients where the Wald test can be conservative due to the Hauck-Donner effect.

ロジスティック回帰をAPA第7版で報告する方法 — オッズ比・Wald検定・モデル適合度

ロジスティック回帰の報告に特別な注意が必要な理由

ロジスティック回帰は、心理学から疫学、教育学に至る分野で二値の結果を予測するための標準的な手法です。1つの検定統計量と1つの効果量を報告するt検定や分散分析とは異なり、ロジスティック回帰は階層的な出力セットを産出します：全体的なモデル適合度、擬似R二乗値、分類精度、そして B 係数、標準誤差、Waldカイ二乗値、p 値、オッズ比、信頼区間を含む個々の予測変数の統計量です。

報告の課題は量だけではありません。ロジスティック回帰の各統計量は、線形回帰のそれとは異なる独自の解釈を持ちます。B 係数は元の単位での傾きではなく対数オッズ値です。擬似R二乗は通常の最小二乗法のR二乗とは同じ量ではありません。そしてオッズ比は日常的に確率の比として誤解されています。

ロジスティック回帰の記述から何か一つの要素でも欠けていることは、修正依頼の最も頻繁な理由の一つです。本ガイドでは、二値ロジスティック回帰の結果をAPA第7版形式で報告するための完全なステップバイステップのアプローチを提供します。

ロジスティック回帰を使用する場面

二値の結果変数

ロジスティック回帰は、従属変数がちょうど2つのカテゴリを持つ場合に適切です：はい/いいえ、合格/不合格、診断あり/健康、卒業/中退。

複数の予測変数（連続型とカテゴリカル型）

ロジスティック回帰は、同一モデル内で連続型予測変数（年齢、GPA、収入）とカテゴリカル型予測変数（性別、処置群、教育水準）の両方を扱います。

線形回帰との比較

| 特徴 | 線形回帰 | ロジスティック回帰 | |------|---------|-----------------| | 結果変数 | 連続 | 二値（0/1） | | 係数の解釈 | Xの1単位あたりのYの変化 | Xの1単位あたりの対数オッズの変化 | | 主要な効果量 | B または β | オッズ比（OR） | | モデル適合度 | R², 調整済み R² | Nagelkerke R², 分類精度 | | 全体モデルの検定 | F 統計量 | カイ二乗（尤度比） |

ロジスティック回帰の基本APA形式

全体モデルの適合度

The overall model was statistically significant, χ²(df) = X.XX, p = .XXX, Nagelkerke R² = .XX.

ここでのカイ二乗はオムニバス尤度比検定で、完全モデル（すべての予測変数を含む）とヌルモデル（切片のみ）を比較します。

個々の予測変数

B = X.XX, SE = X.XX, Wald χ²(1) = X.XX, p = .XXX, OR = X.XX, 95% CI [X.XX, X.XX]

ロジスティック回帰の報告：ステップバイステップ

研究シナリオ

大学の研究者が、200名の学部生の卒業状況（卒業 vs. 未卒業）を3つの変数が予測するかどうかを検討します：

GPA（連続、0.00～4.00）
週間勉強時間（連続）
出席率（連続、0-100%）

結果変数は卒業状況で、1 = 卒業、0 = 未卒業としてコーディング。200名のうち128名（64%）が卒業、72名（36%）が未卒業でした。

ステップ1：モデル適合度統計量の報告

二値ロジスティック回帰を実施し、GPA、週間勉強時間、出席率が200名の学部生の卒業状況を予測するかどうかを検討した。モデル係数のオムニバス検定は、完全モデルが統計的に有意であることを示した, χ²(3) = 42.86, p < .001。モデルは卒業状況の分散の28.4%を説明し（Nagelkerke R² = .284）、ケースの79.5%を正しく分類した。感度は84.4%（卒業者の正確な識別）、特異度は70.8%（未卒業者の正確な識別）であった。Hosmer-Lemeshow検定は十分なモデル適合度を示した, χ²(8) = 5.73, p = .678.

ステップ2：係数表の提示

| 予測変数 | B | SE | Wald χ² | p | OR | ORの95% CI | |---------|------|------|-----------|------|------|-----------| | （定数） | -9.15 | 2.34 | 15.30 | < .001 | -- | -- | | GPA | 1.74 | 0.48 | 13.14 | < .001 | 5.70 | [2.23, 14.57] | | 勉強時間 | 0.16 | 0.06 | 7.11 | .008 | 1.17 | [1.04, 1.32] | | 出席率 (%) | 0.04 | 0.02 | 4.00 | .046 | 1.04 | [1.00, 1.08] |

注. Nagelkerke R² = .284. モデル χ²(3) = 42.86, p < .001. 分類精度 = 79.5%.

ステップ3：APA記述文の作成

GPAは卒業状況の最も強い予測変数であった, B = 1.74, SE = 0.48, Wald χ²(1) = 13.14, p < .001, OR = 5.70, 95% CI [2.23, 14.57]。GPAが1ポイント上昇するごとに、卒業のオッズは他の変数を一定に保った場合に約5.70倍高くなった。週間勉強時間も有意に卒業を予測した, B = 0.16, SE = 0.06, Wald χ²(1) = 7.11, p = .008, OR = 1.17, 95% CI [1.04, 1.32]。週当たり1時間の追加勉強は、卒業のオッズの17%の増加と関連していた。出席率はより小さいが統計的に有意な寄与をした, B = 0.04, SE = 0.02, Wald χ²(1) = 4.00, p = .046, OR = 1.04, 95% CI [1.00, 1.08]。

オッズ比の解釈

オッズ比（OR）はロジスティック回帰における主要な効果量です。他のすべての予測変数を一定に保った場合に、予測変数の1単位の増加に伴い結果のオッズがどのように変化するかを示します。

OR > 1：オッズの増加

OR = 5.70は、予測変数の1単位の増加ごとに結果のオッズが5.70倍高くなることを意味します。パーセンテージの増加として表現すると：(5.70 - 1) × 100 = 470%のオッズ増加です。

OR < 1：オッズの減少

OR = 0.65は、予測変数の1単位の増加がオッズを35%減少させることを意味します。計算：(1 - 0.65) × 100。

1を跨ぐ信頼区間

ORの95% CIは、.05水準での統計的有意性の重要な指標です。区間が1.00を含む場合、予測変数は統計的に有意ではありません。

重要な区別： オッズは確率ではありません。「より高いGPAの学生は卒業する確率が5.70倍高かった」と述べることは技術的に不正確です。正しい表現は「卒業のオッズが5.70倍高かった」です。

モデル適合度の指標

Nagelkerke R二乗

Nagelkerke R²は、明確な上限を持つため、APA報告の標準的な選択肢です。常に使用している擬似R二乗のラベルを明記してください。「R² = .28」とNagelkerkeを指定せずに書くことは、通常の最小二乗法のR二乗と誤解される可能性があります。

| Nagelkerke R² | おおよその解釈 | |-----------------|-------------| | .02 ～ .12 | 小さい効果 | | .13 ～ .25 | 中程度の効果 | | .26以上 | 大きい効果 |

Hosmer-Lemeshow検定

Hosmer-Lemeshow適合度検定は、十分位サブグループ全体で予測確率が観測結果と一致するかどうかを評価します。非有意な結果（p > .05）は十分なモデル適合度を示します。

分類精度表

分類精度を常にベースレートと比較してください。本例では64%の学生が卒業しました。すべての学生に「卒業」と予測するモデルは、予測変数ゼロで64%の精度を達成します。モデルの79.5%の精度は、そのナイーブなベースラインからの15.5ポイントの改善を表しています。

AUC-ROC

| AUC値 | 識別レベル | |-------|----------| | .50 | 偶然と変わらない | | .60 - .69 | 不良 | | .70 - .79 | 許容可能 | | .80 - .89 | 優秀 | | .90以上 | 卓越 |

よくある間違いと回避方法

オッズ比なしで非標準化Bを報告する

ロジスティック回帰の B 係数は対数オッズ値です。「B = 1.74」が何を意味するかは、オッズ比（OR = e^1.74 = 5.70）に変換しなければ読者に把握できません。常に B とORの両方を報告してください。

オッズ比の信頼区間を含めない

信頼区間のないオッズ比は、精度の指標のない点推定値です。APA第7版は効果量の測定に対して明示的に信頼区間を要求しています。

線形回帰のR二乗を使用する

ロジスティック回帰は従来のR二乗を産出しません。Nagelkerke R²（またはCox & Snell R²）であることを明記してください。

多重共線性を無視する

2つ以上の予測変数が高い相関を持つ場合、標準誤差が膨張し、個々のWald検定の検出力が低下し、係数の符号が反転する可能性があります。分散拡大係数（VIF）を検査してください。VIF値が5未満であれば一般的に許容されます。

オッズ比を確率の比として解釈する

ロジスティック回帰報告における最も一般的な解釈エラーです。

不正確： 「より高いGPAの学生は卒業する確率が5.70倍高かった」

正確： 「GPAが1ポイント上昇するごとに、卒業のオッズが5.70倍高かった」

参照カテゴリを明記しない

カテゴリカル予測変数の場合、オッズ比はコーディングされた群をその参照カテゴリと比較します。参照を述べないと結果は解釈不能になります。

ロジスティック回帰APAチェックリスト

原稿を提出する前に、ロジスティック回帰の結果に以下が含まれていることを確認してください：

ロジスティック回帰の種類（二値、多項、順序）
サンプルサイズと結果群の度数
自由度と p 値付きのオムニバスカイ二乗
擬似R二乗と明確にラベル付けされたNagelkerke R²
感度と特異度を含む分類精度
ベースレートとの比較
B、SE、Wald χ²、p、OR、ORの95% CIを含む係数表
表中の切片（定数）行
オッズではなく確率としてのオッズ比の解釈
カテゴリカル予測変数の参照カテゴリの記載
すべてのオッズ比の信頼区間
すべての統計記号のイタリック体（B、SE、p、χ²、R²）
仮定の検討への言及（ロジットの線形性、多重共線性、サンプルサイズ）

よくある質問

二値、多項、順序ロジスティック回帰の違いは何ですか？

二値ロジスティック回帰は二値の結果（2カテゴリ）を予測します。多項ロジスティック回帰は3つ以上の順序のないカテゴリ（例：好みの交通手段：車、バス、自転車）を予測します。順序ロジスティック回帰は順序のあるカテゴリ（例：疾患の重症度：軽度、中等度、重度）を予測します。

1未満のオッズ比をどう解釈しますか？

OR < 1.00は結果のオッズの減少を示します。(1 - OR) × 100でパーセンテージの減少を計算します。例：OR = 0.65は、予測変数の1単位の増加あたりオッズが35%減少することを意味します。

ロジスティック回帰の最小サンプルサイズは？

古典的なガイドラインは、予測変数あたり少なくとも10イベント（EPV）で、イベントは少ない方の結果カテゴリのケースです。より最近のシミュレーション研究では、安定した係数推定のためにEPV 20以上を推奨しています。

Wald検定と尤度比検定の違いは何ですか？

Wald検定は係数と標準誤差の比を用いて個々の予測変数の係数を評価します。尤度比検定は-2対数尤度の変化を調べることでネストされたモデルを比較します。尤度比検定の方が一般的にはより信頼性が高く、特に大きな係数ではHauck-Donner効果によりWald検定が保守的になる場合があります。

計算の正確性

SPSS や R の出力からモデル適合度統計量、オッズ比、信頼区間、分類表を集め、APA第7版形式にフォーマットすることは面倒でエラーが発生しやすい作業です。StatMateのロジスティック回帰計算ツールはプロセス全体を自動化します。

二値の結果と予測変数を入力すると、StatMateがオムニバスモデル検定、Nagelkerke R²、感度と特異度を含む分類表、B、SE、Waldカイ二乗、p、オッズ比、95%信頼区間を含む個々の予測変数の統計量を計算します。結果はAPA第7版形式でフォーマットされ、原稿に直接コピーできます。