分割表の独立性の検定と適合度検定。結果はAPA第7版形式で表示されます。
カイ二乗(χ²)検定は、カテゴリ変数間の関係を検定するために 使用されるノンパラメトリック統計検定です。平均を比較するt検定や分散分析 (ANOVA)とは異なり、カイ二乗検定は度数データ—各カテゴリに属する 観測値の数—を使用します。Karl Pearsonが1900年に開発したこの検定は、 実際に観測された度数と、変数間に関係がない場合に期待される度数を比較します。 観測度数と期待度数の差が十分に大きい場合、変数間に統計的に有意な関連が あると結論づけることができます。
独立性の検定は、2つのカテゴリ変数が互いに関連しているかどうかを判断する ために使用されます。データは、行が一方の変数を、列がもう一方の変数を 表す分割表(クロス集計表)として整理されます。例えば、性別と製品の好みの 間に関係があるかどうか、または治療条件と回復結果の間に関係があるかどうかを 検定できます。帰無仮説は、2つの変数が独立である—すなわち、一方の 変数の値を知っても、もう一方について何の情報も得られない—と主張します。
適合度検定は、単一のカテゴリ変数の観測度数が期待度数と異なるかどうかを 判断するために使用されます。例えば、サイコロが公正かどうかを確認するために 観測されたサイコロの結果を期待される均等分布(各面1/6)と比較したり、 顧客の来店が曜日ごとに均等に分布しているかを検定したりできます。帰無仮説は、 観測分布が期待分布と一致すると主張します。
研究者が、性別(男性 / 女性)と製品の好み(A / B / C)の間に関連が あるかを検定するために100名を対象に調査を実施しました。観測度数は 以下の通りです:
| 観測値 | 製品 A | 製品 B | 製品 C | 行合計 |
|---|---|---|---|---|
| 男性 | 30 | 10 | 10 | 50 |
| 女性 | 15 | 20 | 15 | 50 |
| 列合計 | 45 | 30 | 25 | 100 |
期待度数は(行合計 × 列合計)/ 総合計で計算されます。例えば、 男性 × 製品 Aの期待度数 = (50 × 45) / 100 = 22.5です。
| 期待値 | 製品 A | 製品 B | 製品 C |
|---|---|---|---|
| 男性 | 22.5 | 15.0 | 12.5 |
| 女性 | 22.5 | 15.0 | 12.5 |
結果
χ²(2, N = 100) = 8.41, p = .015, Cramér's V = .29
性別と製品の好みの間に統計的に有意な関連が認められました、 χ²(2, N = 100) = 8.41, p = .015、 中程度の効果量(Cramér's V = .29)でした。 男性は製品Aに対する好みが強く、女性は3つの製品にわたってより均等に 分布していました。
適切な検定の選択は、データの種類と標本サイズによって異なります。以下の ガイドを参考に適切な検定を選択してください:
| 状況 | 推奨される検定 |
|---|---|
| 2つのカテゴリ変数(2×2以上の表) | カイ二乗独立性検定 |
| 1つのカテゴリ変数 vs 期待比率 | カイ二乗適合度検定 |
| 2×2表で期待度数 < 5のセルがある場合 | Fisherの正確検定 |
| 順序データ、2つの独立群 | Mann-Whitney U検定 |
| 対応のあるまたはマッチしたカテゴリデータ | McNemar検定 |
| 3つ以上の関連カテゴリ標本 | CochranのQ検定 |
カイ二乗検定の結果を解釈する前に、以下の前提条件が満たされているか 確認してください:
1. カテゴリデータ
両方の変数がカテゴリ型(名義尺度または順序尺度)でなければなりません。 カイ二乗検定は連続型データには適用できません。連続型の測定値がある 場合は、まずグループに分類する必要がありますが(例:年齢 → 年齢層)、これは情報の損失を伴います。
2. 独立な観測
各観測は他のすべての観測と独立でなければなりません。これは、各参加者 またはケースが分割表の1つのセルにのみ寄与すべきことを意味します。 反復測定や対応のある標本はこの仮定に違反します—代わりに McNemar検定を使用してください。
3. 期待度数 ≥ 5
すべての期待セル度数が5以上でなければなりません。セルの20%以上で 期待度数が5未満の場合、カイ二乗近似は信頼できなくなります。この場合、 カテゴリを統合するか、Fisherの正確検定(2×2表の場合)の使用を 検討してください。
4. 相互排他的なカテゴリ
各観測は1つのカテゴリにのみ属さなければなりません。カテゴリは相互 排他的かつ網羅的であり、すべての観測が正確に1つのカテゴリに割り当て られる必要があります。無作為抽出または無作為割り当てによりデータを 収集し、標本が母集団を代表するようにしてください。
p値は関連が統計的に有意かどうかを示しますが、 CramérのVはその関連がどの程度強いかを示します。 大規模な標本では些細な関連でも統計的に有意になり得るため、これは非常に 重要です。CramérのVは0(関連なし)から1(完全な関連) までの範囲を持ち、解釈は自由度(行 − 1または列 − 1の 小さい方)によって異なります:
| 効果量 | df* = 1 | df* = 2 | df* = 3 | df* ≥ 4 |
|---|---|---|---|---|
| 小さい効果 | .10 | .07 | .06 | .05 |
| 中程度の効果 | .30 | .21 | .17 | .15 |
| 大きい効果 | .50 | .35 | .29 | .25 |
*df* = min(行 − 1, 列 − 1)。上記の計算例(2×3表)では df* = 1であるため、V = .29は中程度の効果に相当します。
APA第7版のガイドラインによると、カイ二乗検定の結果報告には、カイ二乗 統計量、自由度、標本サイズ、p値、および効果量の指標を含める必要が あります。以下はテンプレートと実際の例です:
テンプレート
[変数1]と[変数2]の関係を検定するためにカイ二乗独立性検定を実施した。 2つの変数間の関係は[有意であった/有意ではなかった]、 χ²(df, N = XX) = X.XX, p = .XXX, Cramér's V = .XX。
実際の例(上記の計算例に基づく)
性別と製品の好みの関係を検定するためにカイ二乗独立性検定を実施した。 2つの変数間の関係は統計的に有意であった、 χ²(2, N = 100) = 8.41, p = .015, Cramér's V = .29。男性は女性(30%)に比べて 製品Aに対する好みが顕著に高く(60%)、女性は3つの製品全体にわたって より均等に分布していた。
注意:χ²値は小数点以下2桁まで報告します。p値は小数点 以下3桁まで報告し、.001未満の場合は p < .001と表記します。 独立性検定では必ず効果量の指標(Cramér's V)を 含めてください。
StatMateのカイ二乗計算は、Rの chisq.test() 関数およびSPSS出力に対して検証されています。jstatライブラリを使用して カイ二乗確率分布を計算し、期待度数、自由度、CramérのVを標準的な 統計公式に従って算出します。すべての結果はR出力と小数点以下4桁まで 一致します。
t検定
2群の平均値を比較
分散分析
3群以上の平均値を比較
相関分析
関係の強さを測定
記述統計
データを要約
サンプルサイズ
検出力分析・標本計画
1標本t検定
既知の値との比較
マン・ホイットニーU
ノンパラメトリック群間比較
ウィルコクソン検定
ノンパラメトリック対応検定
回帰分析
X-Yの関係をモデル化
重回帰分析
複数の予測変数
クロンバックのα
尺度の信頼性
ロジスティック回帰
二値アウトカムの予測
因子分析
潜在因子構造の探索
クラスカル・ウォリス
ノンパラメトリック3群以上比較
反復測定
被験者内分散分析
二元配置分散分析
要因計画の分析
フリードマン検定
ノンパラメトリック反復測定
フィッシャーの正確検定
2×2表の正確検定
マクネマー検定
対応のある名義データの検定
| 列1 | 列2 | |
|---|---|---|
| 行1 | ||
| 行2 |
データを入力して「計算」をクリックしてください
または「サンプルデータを読み込む」をクリックしてお試しください