コンテンツへスキップ
S
StatMate
ブログ一覧
APA報告法33 min read2026-03-04

Cohen's dをAPA形式で報告する方法(例と解釈基準を含む)

Cohen's d効果量をAPA第7版形式で報告する完全ガイド。解釈基準、Glass's delta、Hedges' g、信頼区間、変換公式、t検定とANOVA事後比較用のコピー&ペーストテンプレートを含む。

Cohen's dを報告する理由

統計的有意性(p 値)は効果の有無を示しますが、効果の大きさは示しません。Cohen's dは、2群間の差を標準化単位で定量化する効果量です。

APA第7版は有意性検定と共に効果量の報告を明示的に要求しています。Cohen's dは2つの平均を比較する際に最も広く報告される効果量であり、t検定、ANOVA事後比較、メタ分析に不可欠です。

APA報告の必須要素

APA第7版でCohen's dを報告する際に含めるべき要素:

  • 効果量の値:Cohen's d を小数点第2位まで
  • 方向:どちらの群がより高い得点を示したか
  • 95%信頼区間:[下限, 上限](可能な場合)
  • 解釈:Cohenの基準に基づく小・中・大
  • 文脈:対応するt または F 統計量と共に

Cohen's d解釈基準

Cohen(1988)が提案した広く使用される解釈ガイドライン:

| d | 解釈 | 意味 | |-----|------|------| | 0.20 | 小さい効果 | 差は実在するが肉眼では識別困難 | | 0.50 | 中程度の効果 | 注意深い観察者が気づく差 | | 0.80 | 大きい効果 | 明白で実質的な差 |

最近の文献で使用される追加参照値:

| d | 解釈 | |-----|------| | < 0.20 | 無視できる水準 | | 0.20-0.49 | 小さい効果 | | 0.50-0.79 | 中程度の効果 | | 0.80-1.19 | 大きい効果 | | ≥ 1.20 | 非常に大きい効果 |

重要:これらは一般的なガイドラインであり、絶対的な基準ではありません。臨床研究では d = 0.30でも結果が生命に関わる場合は実質的に有意な場合があります。常にその分野の文脈で効果量を解釈してください。

Cohen's dの計算方法

対応のないt検定(独立標本)

d = (M1 - M2) / SDpooled

ここで SDpooled = √[(SD12 + SD22) / 2]

対応のあるt検定

d = Mdiff / SDdiff

研究者によっては事前テストのSDや両SDの平均を標準化値として使用します。どの公式を使用したか明記してください。

t統計量からの変換

d = 2t / √df(等しい標本サイズの場合)

d = t √(1/n1 + 1/n2)(異なる標本サイズの場合)

対応のないt検定でのCohen's d報告

基本テンプレート

実験群(M = X.XX, SD = X.XX)は対照群(M = X.XX, SD = X.XX)より有意に高い得点を示した(t(df) = X.XX, p = .XXX, d = X.XX)。

完全な報告例

シナリオ: 個別指導を受けた群(n = 30)と受けなかった群(n = 30)の試験成績比較。

個別指導を受けた学生(M = 82.40, SD = 8.50)は受けなかった学生(M = 74.60, SD = 9.20)より期末試験で有意に高い得点を示した(t(58) = 3.43, p = .001, d = 0.88, 95% CI [0.34, 1.41])。効果量は大きい群間差を示した。

対応のあるt検定でのCohen's d報告

完全な報告例

シナリオ: 25名の参加者における事前・事後の不安スコア。

不安スコアは事前テスト(M = 45.80, SD = 10.20)から事後テスト(M = 38.50, SD = 9.80)へ有意に減少した(t(24) = 4.12, p < .001, d = 0.82, 95% CI [0.38, 1.26])。これは大きい効果に該当する。

ANOVA事後比較でのCohen's d報告

有意なANOVA後のペアワイズ比較では、各比較にdを報告します:

Bonferroni補正を適用した事後比較の結果、A群(M = 78.30)はC群(M = 65.10)より有意に高い得点を示した(p < .001, d = 1.12)。A群とB群(M = 73.50)間の差は有意ではなかった(p = .089, d = 0.41)。B群はC群より有意に高かった(p = .003, d = 0.72)。

p値を超えて効果量が重要な理由

APAの義務規定

アメリカ心理学会出版マニュアル(APA第7版、セクション6.5)は「各主要アウトカムについて、効果量と信頼区間を報告すべきである」と明記しています。これは提案ではなく、APA学術誌に投稿される論文に対する必須要件です。この強調は、p 値のみでは研究結果の評価に不十分であるという数十年にわたる方法論的批判を反映しています。

統計的有意性 vs. 実質的有意性

統計的に有意な結果(p < .05)は実質的重要性を保証しません。十分に大きな標本では、些細な差でも統計的に有意になります。例えば、群あたりn = 10,000の研究では、100点満点のスケールにおける0.3点の差に対してp < .001が得られる可能性があります。p 値は印象的ですが、その差は実質的に無意味です。

Cohen's dは、差を標本サイズとは独立に標準偏差単位で表現することにより、この問題を解決します。d = 0.03であれば、参加者数に関係なく差が些細であることがわかります。逆に、小標本で有意ではなかったがd = 0.60の結果は、検出力が不足して検出できなかった意味のある効果を示唆します。

査読者と学術誌が効果量を要求する理由

効果量はp 値では果たせない複数の機能を提供します。研究間比較を可能にし、治療効果が異なる母集団や設定で一貫しているか評価できます。メタ分析に不可欠であり、メタ分析はp 値ではなく効果量を統合して研究結果を総合します。検出力分析に情報を提供し、将来の研究者が類似の効果を検出するために必要な参加者数を決定できるようにします。最終的に、介入の実施価値を判断する必要がある非統計学者、臨床家、政策立案者に結果を伝達します。

個別指導プログラムは試験成績を有意に向上させた(t(58) = 3.43, p = .001, d = 0.88, 95% CI [0.34, 1.41])。大きい効果量は、このプログラムが約1標準偏差に相当する実質的に意味のある改善を生み出すことを示唆する。

Cohen's dの変種

Cohen's dは単一の公式ではなく、標準化平均差測度のファミリーです。適切な変種の選択は、研究デザインと研究者が受容できる仮定に依存します。

Glass's Delta(Δ)

Glass's deltaは対照群の標準偏差のみを標準化値として使用します:

Δ = (M処置群 - M対照群) / SD対照群

使用場面: 処置が結果変数の平均変動性の両方を変化させると予想される場合。例えば、治療がうつ病スコアを低下させると同時に個人差も縮小する場合、標準偏差をプールすると処置前の変動性が過小評価されます。Glass's deltaは未処置群の自然な変動性を基準として保持します。

APA報告例:

治療群(M = 12.40, SD = 4.80)は対照群(M = 22.60, SD = 8.10)より有意に低いうつ病スコアを示した(t(48) = 5.32, p < .001, Glass's Δ = 1.26, 95% CI [0.82, 1.69])。

Hedges' g

Hedges' gはCohen's dに小標本補正を適用します:

g = d × (1 - 3 / (4(n1 + n2) - 9))

この補正係数(しばしばJと呼ばれる)は、小標本でCohen's dが示すわずかな上方バイアスを除去します。総Nが40を超えるとバイアスは無視できますが、小規模研究ではHedges' gがより正確な推定値を提供します。

使用場面: メタ分析(小規模研究バイアスが重要な場合)、群あたりn < 20の研究、または最もバイアスの少ない推定値が必要な場合。多くのメタ分析ソフトウェアは、デフォルトですべての効果量をHedges' gに変換します。

APA報告例:

介入群の児童(M = 78.90, SD = 11.20)は対照群の児童(M = 72.30, SD = 10.80)より読解力で高い得点を示した(t(18) = 2.31, p = .033, Hedges' g = 0.60, 95% CI [0.05, 1.14])。

変種の選択基準

| 変種 | 標準化値 | バイアス補正 | 適した状況 | |------|---------|------------|----------| | Cohen's d | プールSD | なし | 一般的使用、等分散 | | Glass's Δ | 対照群SD | なし | 不等分散、処置が変動性に影響 | | Hedges' g | プールSD | あり | 小標本、メタ分析 |

判断に迷う場合は、95%信頼区間と共にCohen's dを報告してください。総標本サイズが40未満の場合は、Hedges' gを併記またはCohen's dの代わりに報告することを検討してください。

Cohen's dの信頼区間

信頼区間が不可欠な理由

d = 0.50という点推定値は効果量の最良推定を提供しますが、その精度については何も示しません。95%信頼区間は、母集団効果量の妥当な値の範囲を定量化します。APA第7版はすべての効果量について信頼区間の報告を強く推奨しており、現在多くの学術誌がこれを必須要件としています。

非心t分布法

Cohen's dの周りに信頼区間を構成する最も正確な方法は、非心t分布を使用します。観測されたt統計量は、非心度パラメータ λ = d × √(n1 × n2 / (n1 + n2))を持つ非心t分布に従います。dの95%信頼区間を求めるには、観測されたtが2.5パーセンタイルと97.5パーセンタイルに位置する2つのλ値を見つけ、dに逆変換します。

これは計算が複雑ですが、ほとんどの現代ソフトウェア(RのMBESSパッケージ、Pythonのscipy、StatMateを含むオンライン計算機)に実装されています。

ブートストラップ法

ブートストラップ信頼区間は、分布に関する仮定をより少なくする代替手法を提供します。この手順では、復元抽出によりデータを数千回(通常10,000回)再標本化し、各再標本についてdを計算し、ブートストラップ分布の2.5パーセンタイルと97.5パーセンタイルを信頼区間の境界として使用します。ブートストラップ信頼区間は、小標本、非正規データ、または非心tアプローチが不正確になる可能性のある複雑なデザインで特に有用です。

信頼区間を含むAPA報告

常に効果量の値の直後に信頼区間を配置してください:

介入群は対照群より有意に高い得点を示した(t(58) = 3.43, p = .001, d = 0.88, 95% CI [0.34, 1.41])。

ゼロを含まない信頼区間は、対応するアルファ水準で効果が統計的に有意であることを示します。狭い信頼区間は精度の高い推定値を、広い信頼区間は真の効果量が点推定値と大幅に異なる可能性があることを警告します。

信頼区間の幅の解釈:

| 総N | d = 0.50に対する概算95% CI幅 | |-------|-------------------------------| | 20 | [−0.40, 1.40] | | 60 | [0.00, 1.00] | | 120 | [0.14, 0.86] | | 200 | [0.22, 0.78] |

これらの値は、適切な標本サイズがなぜ重要かを示しています:20名の参加者のみでは、信頼区間がほぼ2 d単位に及び、精度がほとんどありません。

効果量測度間の変換

研究者は、メタ分析、研究間比較、または異なる分析が異なる指標を産出する場合に、効果量測度間の変換が必要になることがあります。

Cohen's dからPearsonのrへ

r = d / √(d2 + 4)

この公式は等しい標本サイズを仮定します。異なる標本サイズの場合:

r = d / √(d2 + (N2 / (n1 × n2)))

例: d = 0.80は r = 0.80 / √(0.64 + 4) = 0.80 / 2.15 = .37に変換されます。

APA報告: メタ分析のために変換する場合、次のように記述します:「Cohen's d = 0.80を公式 r = d / √(d2 + 4)を用いてメタ分析統合のためにr = .37に変換した。」

Cohen's dからオッズ比へ

ロジスティック回帰またはオッズ比を報告する臨床研究の場合:

ln(OR) = d × π / √3

OR = exp(d × 1.814)

例: d = 0.50は OR = exp(0.50 × 1.814) = exp(0.907) = 2.48に変換されます。

この変換は両群でロジスティック分布を仮定します。近似的ですが、実験研究と観察研究を統合する医学研究やメタ分析で広く使用されています。

イータ二乗からCohen's dへ

ANOVA効果量をペアワイズ比較に変換する場合:

d = 2 × √(η2 / (1 - η2))

例: η2 = .06(中程度のANOVA効果)は d = 2 × √(.06 / .94) = 2 × 0.253 = 0.51に変換されます。

注:この公式は2群比較に適用されます。多群ANOVAでは、η2はペアワイズの差ではなく全体的効果を反映します。

変換クイックリファレンス

| 変換元 | 変換先 | 公式 | |--------|--------|------| | d | r | r = d / √(d2 + 4) | | r | d | d = 2r / √(1 - r2) | | d | OR | OR = exp(d × π / √3) | | OR | d | d = ln(OR) × √3 / π | | η2 | d | d = 2√(η2 / (1 - η2)) | | d | η2 | η2 = d2 / (d2 + 4) |

研究デザイン別のCohen's d

Cohen's dの公式は研究デザインによって異なります。間違った公式の使用は、効果量報告における最も一般的な誤りの一つです。

独立標本デザイン

標準公式はプールされた標準偏差を使用します:

d = (M1 - M2) / SDpooled

ここで SDpooled = √[((n1 - 1)SD12 + (n2 - 1)SD22) / (n1 + n2 - 2)]

APA例:

実験条件の参加者(M = 85.20, SD = 12.40, n = 35)は統制条件の参加者(M = 78.60, SD = 11.80, n = 35)より高い遂行を示した(t(68) = 2.27, p = .026, d = 0.54, 95% CI [0.06, 1.02])。

対応のあるデザイン

3つの一般的な標準化値が存在し、それぞれ異なるd値を産出します:

方法1:差得点のSD(Cohen's dz

dz = Mdiff / SDdiff

これは数学的に対応のあるt統計量を√nで除したものと等価です。計算が最も簡単ですが、被験者内相関がSDdiffを減少させるため、他の方法より大きい値を産出します。

方法2:両時点のプールSD(Cohen's dav

dav = Mdiff / SDav

ここで SDav = √[(SDpre2 + SDpost2) / 2]

独立標本のdと比較可能であるため、メタ分析で推奨されます。

方法3:事前テストSDのみ(Glass's Δ)

Δ = Mdiff / SDpre

介入が変動性を変化させると予想される場合に使用します。

APA例(標準化値を明記):

痛みスコアはベースライン(M = 7.20, SD = 2.10)から治療後(M = 4.80, SD = 1.90)へ有意に減少した(t(29) = 5.44, p < .001, dav = 1.20, 95% CI [0.72, 1.67])。Cohen's dは2つの標準偏差の平均を標準化値として計算した。

一標本デザイン

d = (M - μ0) / SD

ここでμ0は仮説的母集団平均です。

APA例:

標本平均(M = 107.30, SD = 14.50)は母集団基準値100より有意に高かった(t(49) = 3.57, p < .001, d = 0.50, 95% CI [0.21, 0.80])。

複数条件の反復測定デザイン

反復測定ANOVAの事後ペアワイズ比較では、被験者間デザインとの比較可能性を維持するために、差得点のSDではなく当該2条件のプールSDを使用してdを計算します:

事後比較の結果、時点3(M = 92.10)の遂行は時点1(M = 78.40)より高かった(p < .001, dav = 1.05)。時点2(M = 86.30)と時点1間の差も有意であった(p = .008, dav = 0.61)。

Cohen's d vs. 他の効果量

| 効果量 | 使用場面 | 範囲 | 使用条件 | |--------|---------|------|---------| | Cohen's d | 2群比較 | 0〜∞ | t検定、ペアワイズ比較 | | η2p | ANOVA(3群以上) | 0〜1 | F検定全体の効果 | | r | 相関、Mann-Whitney U | -1〜1 | ノンパラメトリック検定 | | オッズ比 | ロジスティック回帰 | 0〜∞ | 二値結果 |

よくある間違い

1. 分散が異なるときにプールSDを使用

標準的なCohen's dの公式は母集団分散が等しいことを仮定します。群間の分散が大きく異なる場合(比率 > 2:1)、プールSDは両群を正確に反映しません。このような場合、対照群のSDを標準化値として使用するGlass's deltaを使用するか、Welch's t検定と共に効果量を報告し分散の差を明記してください。標準化値を選択する前にLevene検定を確認することが良い実践です。

2. 効果量解釈時の標本サイズの無視

群あたりn = 8でのd = 1.50は、群あたりn = 200でのd = 0.40よりはるかに信頼性が低くなります。小標本は広い信頼区間を持つ不安定な推定値を産出します。常に点推定値と共に信頼区間を報告してください。95% CIが0.10から2.90に及ぶ場合、データは無視できる効果から非常に大きい効果まですべてと整合的であり、強い結論は正当化されません。

3. 絶対値のみの報告

Cohen's dは差の方向を伝える符号を持ちます。どちらの群がより高い得点を示したか明記せずに|d| = 0.65とのみ報告すると、重要な情報が失われます。常に本文で方向を明確に記述してください:「処置群がより高い得点を示した(d = 0.65)」は有益ですが、「d = 0.65」のみでは曖昧です。

4. 信頼区間の未報告

APA第7版は効果量の信頼区間を要求しています。信頼区間のない点推定値は読者に精度に関する情報を提供しません。多くの研究者がソフトウェアが提供しないために信頼区間を省略しています。95% CIと共にdを自動出力する専用計算機(StatMateのt検定計算機など)を使用してください。

5. 研究間でのd変種の混同

対応のあるデザインのdzを独立デザインのdと直接比較することは、dzが被験者内相関により膨張するため誤解を招きます。デザイン間で効果量を比較する場合は、対応のあるdzdavに変換するか、使用した変種を明記してください。メタ分析では、この区別は系統的バイアスを回避するために重要です。

6. 効果量の完全な省略

APA第7版はすべての主要アウトカムについて効果量を要求しています。tpのみを報告しdを含めないことは不完全であり、デスクリジェクションにつながる可能性があります。有意でない結果でも、将来のメタ分析と検出力分析を支援するために効果量と信頼区間を含めるべきです。

よくある質問

Cohen's dとHedges' gの違いは何ですか?

Cohen's dとHedges' gはどちらも2群間の標準化平均差を測定します。主な違いは、Hedges' gがCohen's dに内在するわずかな上方バイアスを除去する小標本補正係数を含むことです。総Nが40を超えると、2つの測度はほぼ同一です(補正係数が0.99を超える)。小標本では、Hedges' gがバイアスの少ない推定値を提供します。ほとんどのメタ分析ソフトウェアは、さまざまなサイズの研究をバイアスなく統合するために、デフォルトでHedges' gを使用します。

Cohen's dは負の値を取りますか?

はい。Cohen's dの符号は差の方向を示します。負のdは、第2群の平均が第1群の平均より高いことを意味します。慣例は群の定義方法に依存します。処置研究では、dは通常、処置群から対照群を引いて計算されるため、正のdは処置群がより高い得点を示したことを意味します。報告時には、符号のみに頼らず、どちらの群がより高いか常に明記してください。

「良い」Cohen's d値はどのくらいですか?

普遍的に「良い」値はありません。Cohenの基準(0.20 小、0.50 中、0.80 大)は広く引用されていますが、大まかなガイドラインとして意図されたものであり、基準ではありません。重要なのは文脈における実質的有意性です。教育ではd = 0.40が学生の成績の意味ある向上を表す可能性があります。医学では生命を救う介入に対するd = 0.20は非常に重要です。心理療法では平均的処置効果は約d = 0.80です。常にその分野の出版された基準と効果量を比較してください。

平均と標準偏差からCohen's dをどう計算しますか?

2つの独立した群の場合:平均を引き(M1 - M2)、プールされた標準偏差で除します。等しい標本サイズの場合、プールSD = √[(SD12 + SD22) / 2]、異なる標本サイズの場合、√[((n1-1)SD12 + (n2-1)SD22) / (n1+n2-2)]です。例えば、M1 = 82、SD1 = 10、M2 = 76、SD2 = 12の場合:d = (82 - 76) / √[(100 + 144) / 2] = 6 / 11.05 = 0.54。

有意でない結果でもCohen's dを報告すべきですか?

はい、常に報告すべきです。APA第7版は統計的有意性に関係なく、すべての推測統計について効果量を要求しています。効果量と信頼区間が報告された有意でない結果は、いくつかの理由で価値があります:メタ分析に貢献し、将来の研究の検出力分析に情報を提供し、真のヌル効果(狭いCIと共にdがゼロに近い)と検出力不足の研究(中程度のdだがCIにゼロを含む)を区別するのに役立ちます。

標本サイズはCohen's dにどう影響しますか?

Cohen's d自体は、平均差を標準誤差ではなく標準偏差で除するため、数学的に標本サイズから独立しています。しかし、標本サイズは推定値の精度に影響します。小標本は広い信頼区間を持つ非常に変動的なd推定値を産出し、観測されたdが真の母集団効果と大幅に異なる可能性があります。また、Cohen's dは小標本でわずかな上方バイアスがあり、Hedges' gがこれを補正します。

ノンパラメトリック検定にCohen's dを使用できますか?

Cohen's dは平均の比較用に設計されており、おおよそ正規分布を仮定します。Mann-Whitney U検定やWilcoxon符号付き順位検定のようなノンパラメトリック検定の適切な効果量は、順位二列相関 r = Z / √Nです。変換が必要な場合、d = 2r / √(1 - r2)を使用してrからdを近似できますが、この変換は正規性と等分散を仮定することに注意してください。

どのソフトウェアが信頼区間付きでCohen's dを計算しますか?

ほとんどの主要統計パッケージがCohen's dを計算できます:R(effsizeまたはMBESSパッケージ)、Python(scipyまたはpingouin)、JASP、jamoviはすべて95% CI付きのdを提供します。SPSSはCohen's dを自動計算しないため、手計算またはシンタックスが必要です。StatMateのt検定計算機のようなオンラインツールは、d、95% CI、APA形式の結果文を自動計算し、エラーのないプロセスを提供します。

自分のデータで分析する

無料のt検定計算機を使えば、Cohen's d、95%信頼区間、APA形式の結果文を自動で提供します。ANOVA事後比較は一元配置分散分析計算機をご利用ください。

今すぐ計算してみましょう

StatMateの無料統計計算ツールでデータを分析し、APA形式の結果を取得しましょう。

計算を始める

統計のヒントを受け取る

統計分析、APAフォーマット、新しい計算ツールの更新情報を毎週お届けします。

スパムはありません。いつでも解除できます。