What is Fisher's exact test used for?

Fisher's exact test evaluates whether there is a statistically significant association between two categorical variables arranged in a contingency table. It calculates the exact probability of observing the data under the null hypothesis of independence. It is used instead of the chi-square test when sample sizes are small or when expected cell frequencies fall below the threshold required for the chi-square approximation to be reliable. The test is most commonly applied to 2x2 tables but can be extended to larger tables using the Freeman-Halton extension.

Can Fisher's exact test be used with large samples?

Yes. Fisher's exact test produces valid results at any sample size. The test was originally developed for small samples because exact computation was expensive, but modern software handles even large tables efficiently. Some statisticians recommend Fisher's exact test as the universal default for all 2x2 tables. The only practical limitation is computational: for very large R x C tables, Monte Carlo simulation may be used instead of exact enumeration.

What is the difference between Fisher's exact test and chi-square?

The chi-square test calculates an approximate p value based on the chi-square distribution, which assumes large expected cell frequencies. Fisher's exact test calculates the exact p value by enumerating all possible tables with the same marginal totals. When expected frequencies are adequate (all cells >= 5), both tests produce similar results. When expected frequencies are low, Fisher's exact test is preferred because the chi-square approximation becomes unreliable.

How do I calculate the odds ratio from a 2x2 table?

For a 2x2 table with cells labeled a, b, c, d (where a and b are in row 1, c and d are in row 2), the odds ratio is calculated as OR = (a x d) / (b x c). An OR greater than 1 indicates higher odds of the outcome in the first row group. An OR of exactly 1 indicates no association. Always report the 95% confidence interval alongside the point estimate.

What does a non-significant Fisher's exact test mean?

A non-significant result (p > .05) means there is insufficient evidence to conclude that an association exists between the two variables. It does not prove independence. With small samples, Fisher's exact test has limited statistical power. Report the effect size (OR and 95% CI) even for non-significant results, as this information is valuable for future meta-analyses and power calculations.

Should I report Fisher's exact test if chi-square is also available?

If your expected cell frequencies meet the Cochran guideline (no more than 20% below 5, none below 1), reporting the chi-square test is standard and preferred because it includes a test statistic and degrees of freedom. If expected frequencies are inadequate, Fisher's exact test should be reported instead. If you run both and results diverge, report Fisher's exact test and note the discrepancy.

How do I report Fisher's exact test in SPSS output?

In SPSS, Fisher's exact test appears in the Chi-Square Tests output table as 'Fisher's Exact Test' with columns for Exact Sig. (2-sided) and Exact Sig. (1-sided). Report the two-sided value unless you have a justified directional hypothesis. Use the Risk Estimate table for the odds ratio and its 95% CI. Report as: Fisher's exact test, p = .XXX, OR = X.XX, 95% CI [X.XX, X.XX].

Can Fisher's exact test be used for tables larger than 2x2?

Yes. The Freeman-Halton extension generalizes Fisher's exact test to any R x C table. Most modern software (R, Python, SAS, Stata) supports this extension. For tables beyond approximately 6x6 or with large marginals, the computation may require Monte Carlo simulation. Report the table dimensions, the percentage of cells with expected frequencies below 5, the exact or simulated p value, and Cramer's V as the effect size.

Fisher正確確率検定のAPA形式での報告方法：オッズ比・信頼区間・小標本ガイド

Fisher正確確率検定を正しく報告すべき理由

Fisher正確確率検定は、生物医学、行動科学、社会科学の研究で最も広く使用される統計手法の一つです。小標本、希少事象、不均衡なセル度数を持つ分割表でカテゴリカルデータを分析する際に頻繁に用いられます。登録数が限られた臨床試験、パイロット研究、まれな曝露を扱う症例対照研究、小規模グループの実験研究のすべてがこの検定に依存しています。

広く使用されているにもかかわらず、Fisher正確確率検定はしばしば誤って報告されます。よくある誤りとして、検定が産出しないカイ二乗統計量の報告、効果量の省略、片側検定と両側検定の未明記、信頼区間の欠落があります。これらの誤りはそれぞれ、研究結果の解釈可能性を弱め、査読中の原稿却下につながる可能性があります。

本ガイドでは、Fisher正確確率検定の完全なAPA第7版報告に必要なすべての要素を解説します。Fisher正確確率検定とカイ二乗検定の選択、関連する効果量指標（オッズ比、相対リスク、ファイ係数、CramerのV）、大きな表のためのFreeman-Halton拡張、mid-p調整を含む片側・両側検定、最も一般的な報告ミスについて説明します。

Fisher正確確率検定を使用する場面

Fisher正確確率検定は、分割表を扱うデータにおいて、カイ二乗近似が信頼できないほどサンプルが小さい場合に最適な分析方法です。具体的には、以下のいずれかの条件に当てはまる場合、カイ二乗検定の代わりにFisher正確確率検定を選択すべきです。

期待度数が5未満のセルが全セルの20%以上を占める
総サンプルサイズが20未満
期待度数がゼロのセルがある
2x2表で少なくとも1つの期待度数が小さい

カイ二乗検定はカイ二乗分布への大標本近似に依存しています。期待度数が低い場合、この近似が崩れ、算出されるp値が不正確になります。Fisher正確確率検定は、漸近的近似に依存せず、帰無仮説の下でデータを観測する正確な確率を計算するため、この問題を完全に回避します。

よくある誤解として、Fisher正確確率検定は極めて小さなデータセットにしか使えないと思われがちです。実際には、どのようなサンプルサイズでも有効な結果を生み出します。大標本でカイ二乗検定がデフォルトとされる理由は計算上の便宜であり、統計的な優位性ではありません。現代の多くの統計ソフトウェアは、大きな表に対してもFisher正確確率検定を効率的に計算できます。

APAの報告テンプレート

カイ二乗検定と異なり、Fisher正確確率検定は検定統計量を生成しません。報告すべきカイ二乗値はありません。報告の中心は正確なp値であり、オッズ比などの効果量指標を併せて記載します。

2x2表のAPAテンプレート：

Fisher正確確率検定の結果、[変数1]と[変数2]の間に有意な関連が認められた（p = .XXX, OR = X.XX, 95% CI [X.XX, X.XX]）。

非有意な場合のAPAテンプレート：

Fisher正確確率検定の結果、[変数1]と[変数2]の間に有意な関連は認められなかった（p = .XXX, OR = X.XX, 95% CI [X.XX, X.XX]）。

カイ二乗検定の報告との主な違い：

| 要素 | カイ二乗検定 | Fisher正確確率検定 | |------|------------|-------------------| | 検定統計量 | chi-square(df, N = n) = X.XX | なし | | p値 | p = .XXX | p = .XXX | | 効果量（2x2） | ファイ係数 | オッズ比（OR） | | 効果量（大きい表） | CramerのV | CramerのV | | 信頼区間 | 任意 | ORには推奨 |

2x2表におけるオッズ比の理解

オッズ比（OR）は、2x2表におけるFisher正確確率検定の自然な効果量指標です。一方の群と他方の群を比較して、ある結果がどの程度起こりやすいかを記述します。

オッズ比の解釈：

| OR値 | 解釈 | |------|------| | OR = 1.00 | 関連なし；両群のオッズは等しい | | OR > 1.00 | 第1群でその結果がより起こりやすい | | OR < 1.00 | 第2群でその結果がより起こりやすい | | OR = 2.50 | 第1群のオッズは第2群の2.5倍 | | OR = 0.40 | 第1群のオッズは第2群より60%低い |

スポーツ傷害からの回復に新しい治療法が効果的かどうかを調べる研究を考えてみましょう。治療群10名と対照群10名のうち、治療群では8名が完全回復し、対照群では3名が完全回復した場合、治療群の回復オッズは8/2 = 4.0、対照群のオッズは3/7 = 0.43です。オッズ比は4.0 / 0.43 = 9.33となり、治療群は完全回復のオッズが9倍以上あったことを意味します。

相対リスクと異なり、オッズ比は対称的です。比較を逆にすると単にORが逆数になります（1/9.33 = 0.11）。この性質により、どちらの群も自然な「参照」とならない分割表分析に適しています。

ステップバイステップの報告例

シナリオ： 研究者が短時間のマインドフルネス介入が小規模なクラスにおけるテスト不安を軽減するかどうかを調査した。12名の学生が介入を受け、8名が対照群となった。1週間後、各学生は「不安あり」または「不安なし」に分類された。

観測度数：

| | 不安あり | 不安なし | 合計 | |--|---------|---------|------| | 介入群 | 3 | 9 | 12 | | 対照群 | 6 | 2 | 8 | | 合計 | 9 | 11 | 20 |

総サンプルが20であり、いくつかの期待度数が5未満であるため、カイ二乗検定は不適切です。Fisher正確確率検定が正しい選択です。

結果： p = .035（両側）、OR = 0.11、95% CI [0.01, 0.85]。

完全なAPAパラグラフ：

介入条件（マインドフルネス vs. 対照）と不安状態（不安あり vs. 不安なし）の関係を検討するため、2x2分割表を作成した。2つのセルで期待度数が5未満であったため、カイ二乗検定の代わりにFisher正確確率検定を使用した。分析の結果、介入条件と不安状態の間に有意な関連が認められた（p = .035, OR = 0.11, 95% CI [0.01, 0.85]）。マインドフルネス群の学生は、対照群と比較して不安を報告するオッズが大幅に低かった。

この報告では、Fisher正確確率検定を選択した正当化、両側p値の報告、信頼区間付きのオッズ比、効果の方向に関する平易な解釈が含まれています。

信頼区間の報告

オッズ比の信頼区間はp値だけよりも多くの情報を提供します。p値は関連が統計的に有意かどうかを示しますが、信頼区間は効果がどれだけ正確に推定されたか、また妥当な効果量の範囲を示します。

ORの信頼区間の解釈ルール：

95% CIに1.00が含まれる場合、.05水準で関連は有意でない
95% CIが1.00を含まない場合、.05水準で関連は有意である
狭いCIは精度の高い推定を示す
広いCIはかなりの不確実性を示す（小標本でよく見られる）

たとえば、OR = 3.20、95% CI [0.75, 13.60]は区間が1.00をまたいでいるため有意ではありません。一方、OR = 3.20、95% CI [1.10, 9.30]は区間全体が1.00を上回っているため有意です。

Fisher正確確率検定では、一般的に小標本で使用されるため、信頼区間が広くなることが多いです。これは検定自体の弱点ではなく、小標本が提供する限られた精度を正直に反映しています。CIを報告することで、読者が効果が意味のあるものかどうかを自ら判断できるようになります。

CIを強調したAPAの記述：

Fisher正確確率検定は有意な関連を示した（p = .041, OR = 4.20, 95% CI [1.05, 16.80]）。オッズ比は実質的な効果を示唆しているが、広い信頼区間は限られたサンプルサイズを反映しており、下限は1.00に近い。

Fisher正確確率検定 vs カイ二乗検定：選択の判断基準

Fisher正確確率検定とカイ二乗検定の選択は、カイ二乗の基盤である大標本近似がデータに適切かどうかに依存します。これは単なる技術的な詳細ではなく、誤った選択は誤解を招くp値を生じさせ、査読に支障をきたす可能性があります。

期待度数のルール。 Cochran（1954）が定式化した古典的なガイドラインによると、期待度数が5未満のセルが20%を超えず、期待度数が1未満のセルがない場合にカイ二乗近似は許容されます。これらの条件が違反されると、カイ二乗のp値はかなり自由すぎる（帰無仮説を頻繁に棄却しすぎる）か保守的すぎる（効果が実在するのに棄却できない）可能性があります。

サンプルサイズの閾値。 実用的な経験則として、2x2表で総サンプルサイズNが20未満の場合、または行・列周辺度数が非常に小さい場合（5未満）はFisher正確確率検定をデフォルトにすべきです。20から40のサンプルでは、期待度数の分布によってどちらの検定も適切な場合があります。バランスの取れた周辺度数でN > 40であれば、カイ二乗検定は一般的に信頼できます。

APA形式での選択の正当化方法：

セルの50%（4セル中2セル）で期待度数が5未満であったため、Pearsonのカイ二乗検定の代わりにFisher正確確率検定を使用した（Agresti, 2007）。

サンプルサイズ（N = 18）はカイ二乗近似に不十分であった。そのためFisher正確確率検定を使用した。

すべての期待度数が5を超え、総サンプルサイズは120であった。Pearsonのカイ二乗検定を使用した。

両検定の結果が一致する場合。 両方を実施してp値が類似していれば、読者により馴染みがあり検定統計量（chi-square(df) = X.XX）という追加情報を含むカイ二乗検定を報告してください。p値が有意に異なる場合は、分布近似に依存しないFisher正確確率検定を信頼してください。

保守的検定の議論。 一部の方法論者、特に臨床研究では、サンプルサイズに関係なくすべての2x2表にFisher正確確率検定を使用すべきだと主張しています。現代のコンピューティングでは正確な計算が容易であり、正確なp値が近似的なp値より不正確になることはないという理論です。この立場は妥当であり、医学ジャーナルで増加しています。この方針を採用する場合は、方法セクションに明示的に記述してください。

| 基準 | カイ二乗検定 | Fisher正確確率検定 | |------|------------|-------------------| | 期待度数 | すべてのセルが5以上 | 5未満のセルがある | | サンプルサイズ | 一般的にN > 40 | 任意のサンプルサイズ | | 表のサイズ | 任意の次元 | 任意の次元（2x2が最も一般的） | | 報告する検定統計量 | chi-square(df) = X.XX | なし（正確なp値のみ） | | 効果量（2x2） | ファイ係数 | オッズ比 | | 効果量（大きい表） | CramerのV | CramerのV | | 計算 | 高速 | 大きな表では低速 | | 精度 | 近似的 | 正確 |

Fisher正確確率検定の効果量

APA第7版はすべての推測検定に効果量を要求していますが、多くのFisher正確確率検定の報告にはp値のみが含まれています。このセクションでは、分割表分析に関連する4つの効果量指標、それぞれが適切な場面、APA形式での報告方法を解説します。

オッズ比（OR）

オッズ比は、Fisher正確確率検定で分析された2x2表の主要な効果量です。2群間のオッズの乗法的変化を定量化します。Cohenのdやrと異なり、ORは結果のベースレートによって解釈が変わるため、単純な「小/中/大」の基準がありません。

おおよその基準（Chen et al., 2010を適用）：

| OR | 解釈 | |----|------| | 1.0 | 効果なし | | 1.5 | 小 | | 2.5 | 中 | | 4.3 | 大 |

ORと併せて95%信頼区間を必ず報告してください。Fisher正確確率検定では、CIの計算方法が複数あります（正確条件付き、mid-p、Cornfield）。正確条件付き法がほとんどのソフトウェアのデフォルトであり、小標本分析に推奨されます。

APA形式：

OR = 3.47, 95% CI [1.12, 10.74]

相対リスク（RR）

相対リスク（リスク比とも呼ばれる）は、一方の群のアウトカム発生確率を他方の群と比較します。オッズ比と異なり、RRは直接的な確率的解釈が可能です。RR = 2.0は、曝露群でアウトカムが2倍起こりやすいことを意味します。

RRは、発生率が意味を持つ前向き研究（コホート、RCT）で好まれます。症例対照研究には適切ではなく、代わりにオッズ比を使用すべきです。

APA形式：

有害事象の相対リスクは2.40、95% CI [1.15, 5.01]であり、実験群の参加者はアウトカムを経験する可能性が2.4倍高かったことを示す。

ORとの重要な違い： アウトカムが希少な場合（両群で10%未満）、ORはRRに近似します。アウトカムが一般的な場合、ORはRRに比べて効果を誇張します。アウトカムが一般的であるのにORのみを報告すると、読者は実質的な影響を過大評価する可能性があります。

ファイ係数

ファイ係数（phi）は2x2表におけるPearsonのrに相当し、0から1（方向を割り当てる場合は-1から+1）の範囲です。馴染みのある相関に類似した尺度で関連の強さを測定します。

基準（Cohen, 1988）：

| ファイ | 解釈 | |--------|------| | .10 | 小 | | .30 | 中 | | .50 | 大 |

ファイ係数は、異なる表構造を使用する研究間で効果量を比較したい場合や、メタ分析のための標準化された指標が必要な場合に有用です。カイ二乗をNで割った値の平方根として計算されます。

APA形式：

Fisher正確確率検定は有意な関連を示した（p = .023, phi = .38）。

CramerのV

CramerのVは、ファイ係数を2x2より大きな表に一般化したものです。2x2表ではCramerのVはファイ係数に等しくなります。より大きな表では、Vは0から1の範囲であり、解釈の基準は自由度（df = min(行 - 1, 列 - 1)）に依存します。

| df | 小 | 中 | 大 | |----|------|------|------| | 1 | .10 | .30 | .50 | | 2 | .07 | .21 | .35 | | 3 | .06 | .17 | .29 |

R x C表のAPA形式：

Fisher正確確率検定（Freeman-Halton拡張）の結果、治療群と症状カテゴリの間に有意な関連が認められた（p = .018, V = .31）。

適切な効果量の選択

| 状況 | 推奨効果量 | |------|----------| | 2x2、症例対照デザイン | オッズ比 + 95% CI | | 2x2、前向き研究（RCT、コホート） | 相対リスク + 95% CI；ORも併記 | | 2x2、メタ分析または研究間比較 | ファイ係数 | | R x C表（すべてのデザイン） | CramerのV |

信頼区間とともに少なくとも1つの効果量指標を報告してください。2x2表で迷った場合、普遍的に受け入れられFisher正確確率検定に直接関連するオッズ比と95% CIが最も安全なデフォルトです。

大きな表（R x C）のFisher正確確率検定

Fisher正確確率検定は2x2表に限定されません。Freeman-Halton拡張は、この手続きを任意のR x C分割表に一般化します。この拡張は、固定された行・列周辺度数を条件として、独立性の帰無仮説の下で与えられた表（およびそれ以上に極端なすべての表）を観測する正確な確率を計算します。

Freeman-Halton拡張を使用する場面

以下の場合にFreeman-Halton拡張を使用してください：

表が2x2より大きい場合（例：2x3、3x3、3x4）
期待度数がCochranのガイドラインに違反する場合（20%以上が5未満）
セル数に対して総サンプルサイズが小さい場合

9セルの3x3表で適切な期待度数を維持するには、4セルの2x2表よりもかなり大きなサンプルが必要です。総N = 45は2x2表には適切かもしれませんが、3x3表には不十分な場合があります。

計算上の考慮事項

表が大きくなるにつれて、正確な計算は指数関数的に要求が厳しくなります。おおよそ6x6を超える表や周辺度数が大きい場合、ほとんどのソフトウェアは正確なp値を近似するためにモンテカルロシミュレーションを使用します。シミュレーションされたpを報告する場合は、反復回数を注記してください。

モンテカルロのAPA形式：

モンテカルロシミュレーション（10,000回反復）により計算されたFisher正確確率検定のFreeman-Halton拡張の結果、診断と治療反応の間に有意な関連が認められた（p = .008, 99% CI [.005, .011], V = .29）。

R x C表のAPA報告テンプレート

[変数1]（3水準）と[変数2]（4水準）の関連を検討するため、3x4分割表を作成した。セルの58%で期待度数が5未満であったため、Fisher正確確率検定のFreeman-Halton拡張を使用した。検定の結果、有意な関連が認められた（p = .014, V = .28（中程度の効果））。Bonferroni補正を適用した事後ペアワイズFisher正確確率検定により、水準Aと水準C（p = .003）および水準Bと水準C（p = .011）の間に有意な差が確認された。

R x C表の事後比較

R x C表に対する有意な全体的Fisher正確確率検定は、関連が存在することを示しますが、どこにあるかは特定しません。ペアワイズの2x2 Fisher正確確率検定で追跡し、多重比較の補正（Bonferroniが最も簡単、Benjamini-Hochberg FDR補正がより強力な代替手段）を適用してください。

片側検定 vs 両側検定のFisher正確確率検定

Fisher正確確率検定は片側または両側で実施できます。選択は、仮説が方向を指定しているかどうかに依存します。

両側検定（デフォルト）

方向に関係なく、何らかの関連が存在するかどうかを検定する場合に使用します。これがほとんどの研究における標準であり、方向性仮説の強い事前の根拠がない限り、デフォルトとすべきです。

片側検定

データ収集前に関連の特定の方向を仮説が予測している場合に使用します。たとえば、「治療群は対照群よりも回復率が高い」という場合です。

区別の報告方法：

Fisher正確確率検定（両側）の結果、治療と回復の間に有意な関連が認められた（p = .035）。

仮説が治療群でのより高い回復を予測していたため、片側Fisher正確確率検定を使用した。結果は有意であった（p = .018）。

片側検定を使用する場合は、方法セクションでその選択を正当化する必要があります。両側の結果が有意でなかったため（p = .07）片側検定に切り替えてp = .035を得ようとすることは、pハッキングの一形態であり許容されません。

Mid-p調整

Fisher正確確率検定は、観測された周辺度数を条件とするため過度に保守的であるという批判を受けることがあります。Mid-p調整は、観測された表の確率の半分に、それ以上に極端なすべての表の確率を加えてp値を計算することで、この問題に対処します。

Mid-p値は常に標準的な正確p値以下であり、やや自由的です。複数の統計学者（Lancaster, 1961; Agresti, 2002）が、保守的な正確検定と自由的なカイ二乗近似の間の妥協案として推奨しています。

Mid-pを含むAPA形式：

Mid-p調整を適用したFisher正確確率検定の結果、ワクチン接種状態と感染の間に有意な関連が認められた（mid-p = .032, OR = 3.15, 95% CI [1.08, 9.17]）。

Mid-pを使用する場面： 標準的な正確pが有意水準に近い場合（例：p = .06）で、より保守的でない分析を求める場合にmid-p調整を検討してください。どの方法を使用したかを必ず報告してください。結果を見てから方法を切り替えないでください。

方向性仮説：APAの正当化

片側検定を報告する場合、APAは明示的な正当化を要求します。仮説セクションに方向性の予測を含め、結果でそれを参照してください：

認知行動介入の効果を示す先行研究（Smith et al., 2023）に基づき、治療群がより高い寛解率を示すと仮説を設定した。したがって、この方向性の予測を検定するために片側Fisher正確確率検定を使用した。結果は有意であった（p = .021, OR = 4.80, 95% CI [1.25, 18.40]）。

Fisher正確確率検定の報告でよくある間違い

間違い1：期待度数が低すぎるのにカイ二乗検定を使用する

これは最も頻繁に見られる誤りです。分割表に期待度数が5未満のセルがある場合、カイ二乗のp値は不正確になる可能性があります。使用する検定を決定する前に、必ず期待度数を確認してください。多くのソフトウェアパッケージ（SPSS、R、Python）は期待度数を自動的に報告します。「1セル（25.0%）の期待度数が5未満」という警告が表示されたら、Fisher正確確率検定に切り替えてください。

間違い2：Fisher検定にカイ二乗統計量を報告する

Fisher正確確率検定はカイ二乗値を生成しません。「chi-square(1) = 4.52, Fisherの正確p = .038」と記述することは、2つの異なる検定を混同しています。これはどの統計手続きも実際には生成しないハイブリッドです。Fisher正確確率検定のp値を単独で報告してください：

誤り： chi-square(1, N = 24) = 4.52, Fisherの正確p = .038

正しい： Fisher正確確率検定、p = .038, OR = 3.75, 95% CI [1.05, 13.40]

間違い3：効果量を省略する

p値だけでは関連の強さや方向を伝えません。2x2のFisher正確確率検定の結果を解釈するためにオッズ比は不可欠です。これがなければ、読者は統計的に有意な関連が実質的にも意味があるかどうかを判断できません。OR = 1.05の有意なpとOR = 8.50の有意なpは非常に異なる意味を持ちます。

間違い4：信頼区間を省略する

信頼区間がなければ、読者はオッズ比の推定の精度を判断できません。点推定が不安定になりやすい小標本研究では特に重要です。OR = 6.00、95% CI [0.80, 45.00]とOR = 6.00、95% CI [2.10, 17.10]は非常に異なる結果を語ります。

間違い5：結果を見てから片側検定に切り替える

事前登録された仮説が非方向性であった場合は、両側p値を報告しなければなりません。事後的に片側検定に切り替えることは、第1種の過誤率を膨張させます。これは査読者が発見するよく知られたpハッキングの形態です。方向性の仮説がある場合は、データ収集前に記述し事前登録してください。

間違い6：分割表を無視する

APA形式では、観測度数とパーセンテージを含む分割表の提示が推奨されています。この表は、要約統計量だけでは伝えられない文脈を提供します。読者は報告された分析を検証し、関連のパターンを理解するためにセル度数を確認する必要があります。

間違い7：オッズ比の不正確な解釈

オッズ比は確率ではなくオッズを比較します。OR = 3.0の場合に「治療群の患者は回復する可能性が3倍高かった」と述べるのは厳密には不正確です。正しい表現は「治療群では回復のオッズが3倍高かった」です。オッズと確率は異なる量であり、アウトカムが一般的な場合に大きく乖離するため、この区別は重要です。

間違い8：ソフトウェアと方法を明示しない

ソフトウェアパッケージによって計算アルゴリズムの違い（正確列挙、ネットワークアルゴリズム、モンテカルロシミュレーション）により、Fisher正確確率検定のp値がわずかに異なる場合があります。使用したソフトウェアを必ず明示し、大きな表の場合はp値が正確な計算に基づくものかモンテカルロシミュレーションに基づくものかを記述してください。

Fisher正確確率検定のAPAチェックリスト

論文提出前に、Fisher正確確率検定の報告に以下が含まれていることを確認してください。

カイ二乗検定の代わりにFisher正確確率検定を選択した正当化（例：期待度数が5未満のセル）
正確なp値（単に「有意」「非有意」ではなく）
片側か両側かの明記
2x2表にはオッズ比、大きな表にはCramerのV
オッズ比の95%信頼区間
観測度数を示す分割表（必要に応じてパーセンテージも）
効果の方向と大きさに関する平易な解釈
Fisher正確確率検定のp値と一緒にカイ二乗統計量を報告しない
ソフトウェアと計算方法の明示（正確またはモンテカルロ）

よくある質問

Fisher正確確率検定は何に使用されますか？

Fisher正確確率検定は、分割表に配列された2つのカテゴリカル変数間に統計的に有意な関連があるかどうかを評価します。独立性の帰無仮説の下で、データ（またはそれ以上に極端なデータ）を観測する正確な確率を計算します。サンプルサイズが小さい場合や、期待度数がカイ二乗近似に必要な閾値を下回る場合に、カイ二乗検定の代わりに使用されます。2x2表に最も一般的に適用されますが、Freeman-Halton拡張を使用してより大きな表に拡張できます。

Fisher正確確率検定は大標本でも使用できますか？

はい。Fisher正確確率検定はどのようなサンプルサイズでも有効な結果を生み出します。この検定はもともと正確な計算にコストがかかったため小標本用に開発されましたが、現代のソフトウェアは大きな表でも効率的に処理します。一部の統計学者は、すべての2x2表に対する普遍的なデフォルトとしてFisher正確確率検定を推奨しています。唯一の実用的な制限は計算上のものであり、非常に大きなR x C表では正確な列挙の代わりにモンテカルロシミュレーションが使用される場合があり、これを報告に記載すべきです。

Fisher正確確率検定とカイ二乗検定の違いは何ですか？

カイ二乗検定は、大きな期待度数を仮定するカイ二乗分布に基づいて近似的なp値を計算します。Fisher正確確率検定は、同じ周辺合計を持つすべての可能な表を列挙して正確なp値を計算します。期待度数が十分な場合（すべてのセルが5以上）、両検定は類似した結果を生みます。期待度数が低い場合、カイ二乗近似は信頼できなくなり、Fisher正確確率検定が好まれます。さらに、Fisher正確確率検定は検定統計量を生成せず、正確なp値のみを生成します。

2x2表からオッズ比をどのように計算しますか？

セルがa、b、c、d（aとbが第1行、cとdが第2行）と表記された2x2表では、オッズ比はOR = (a x d) / (b x c)で計算されます。たとえば、a = 8、b = 2、c = 3、d = 7の場合、OR = (8 x 7) / (2 x 3) = 56 / 6 = 9.33です。ORが1より大きい場合、第1行群でアウトカムのオッズがより高いことを示します。ORがちょうど1の場合、関連がないことを示します。点推定とともに95%信頼区間を必ず報告してください。

非有意なFisher正確確率検定の結果は何を意味しますか？

非有意な結果（p > .05）は、2つの変数間に関連が存在すると結論付けるための十分な証拠がないことを意味します。変数が独立であることを証明するものではありません。小標本では、Fisher正確確率検定は統計的検出力が限られているため、実際の関連を検出できない可能性があります。非有意な結果でも効果量（ORと95% CI）を報告してください。この情報は将来のメタ分析と検出力計算に価値があります。広い信頼区間を伴う非有意な検定は、より多くのデータが必要であることを示唆します。

カイ二乗検定も利用可能な場合、Fisher正確確率検定を報告すべきですか？

期待度数がCochranのガイドライン（5未満が20%を超えない、1未満がない）を満たしていれば、検定統計量と自由度を含むカイ二乗検定の報告が標準的であり好まれます。期待度数が不十分な場合は、代わりにFisher正確確率検定を報告すべきです。臨床研究の一部のジャーナルでは、サンプルサイズに関係なくすべての2x2分析にFisher正確確率検定を期待しています。両方を実施して結果が異なる場合は、Fisher正確確率検定を報告し、不一致を注記してください。

SPSSの出力からFisher正確確率検定をどのように報告しますか？

SPSSでは、Fisher正確確率検定はカイ二乗検定の出力表に「Fisherの正確確率検定」として表示され、正確有意確率（両側）と正確有意確率（片側）の列があります。正当化された方向性仮説がない限り、両側の値を報告してください。SPSSはFisher検定のオッズ比を直接出力しません。リスク推定表（オッズ比と95% CIを報告）を使用するか、クロス集計表から計算してください。報告形式：Fisher正確確率検定、p = .XXX, OR = X.XX, 95% CI [X.XX, X.XX]。

Fisher正確確率検定は2x2より大きな表に使用できますか？

はい。Freeman-Halton拡張はFisher正確確率検定を任意のR x C表に一般化します。ほとんどの現代のソフトウェア（R、Python、SAS、Stata）がこの拡張をサポートしています。おおよそ6x6を超える表や周辺度数が大きい場合、計算にモンテカルロシミュレーションが必要な場合があります。報告時には、表の次元、期待度数が5未満のセルの割合、正確またはシミュレーションされたp値、効果量としてCramerのVを明記してください。シミュレーションされたp値の場合は、使用したモンテカルロ反復回数を報告してください。

StatMateの無料Fisher正確確率検定計算ツールをお試しください

Fisher正確確率検定の結果を手作業でフォーマットするのは煩雑でミスが生じやすいです。StatMateのFisher正確確率検定計算ツールは、論文用のAPA出力を自動的に生成します。2x2表を入力するだけで、正確なp値、オッズ比、信頼区間、論文に直接コピーできる完全なAPA形式の結果パラグラフが返されます。

カイ二乗検定が必要ですか？カイ二乗計算ツールは、CramerのV効果量付きで独立性検定と適合度検定の両方に対応しています。両方の計算ツールとも、Proユーザー向けのワンクリックWord エクスポートと、全ユーザー向けの無料PDFエクスポートを搭載しています。

Fisher正確確率検定を正しく報告すべき理由

Fisher正確確率検定を使用する場面

APAの報告テンプレート

2x2表におけるオッズ比の理解

ステップバイステップの報告例

信頼区間の報告

Fisher正確確率検定 vs カイ二乗検定：選択の判断基準

Fisher正確確率検定の効果量

オッズ比（OR）

相対リスク（RR）

ファイ係数

CramerのV

適切な効果量の選択

大きな表（R x C）のFisher正確確率検定

Freeman-Halton拡張を使用する場面

計算上の考慮事項

R x C表のAPA報告テンプレート

R x C表の事後比較

片側検定 vs 両側検定のFisher正確確率検定

両側検定（デフォルト）

片側検定

Mid-p調整

方向性仮説：APAの正当化

Fisher正確確率検定の報告でよくある間違い

間違い1：期待度数が低すぎるのにカイ二乗検定を使用する

間違い2：Fisher検定にカイ二乗統計量を報告する

間違い3：効果量を省略する

間違い4：信頼区間を省略する

間違い5：結果を見てから片側検定に切り替える

間違い6：分割表を無視する

間違い7：オッズ比の不正確な解釈

間違い8：ソフトウェアと方法を明示しない

Fisher正確確率検定のAPAチェックリスト

よくある質問

Fisher正確確率検定は何に使用されますか？

Fisher正確確率検定は大標本でも使用できますか？

Fisher正確確率検定とカイ二乗検定の違いは何ですか？

2x2表からオッズ比をどのように計算しますか？

非有意なFisher正確確率検定の結果は何を意味しますか？

カイ二乗検定も利用可能な場合、Fisher正確確率検定を報告すべきですか？

SPSSの出力からFisher正確確率検定をどのように報告しますか？

Fisher正確確率検定は2x2より大きな表に使用できますか？

StatMateの無料Fisher正確確率検定計算ツールをお試しください

今すぐ計算してみましょう

統計のヒントを受け取る