コンテンツへスキップ
S
StatMate
ブログ一覧
使い方ガイド22 min read2026-02-20

探索的因子分析(EFA)の実行方法 — ステップバイステップガイド

探索的因子分析を最初から最後まで実行する方法を解説します。データの適合性チェック、因子抽出、回転、因子負荷量の解釈を実践的な例とともに説明します。

探索的因子分析とは?

探索的因子分析(EFA)は、一連の観測変数の背後にある構造を明らかにする統計手法です。多数の調査項目や測定値がある場合、EFAはそれらの項目が少数の潜在因子にまとまるかどうかを判定するのに役立ちます。

例えば、20項目のパーソナリティ質問紙が実際には5つの潜在的な特性を測定しているかもしれません。EFAは項目間の相関パターンを調べることで、これらの隠れた次元を特定します。

本ガイドでは、データの適合性確認から最終的な因子解の解釈まで、EFAを実行するすべてのステップを解説します。

EFAを使用すべき場面

EFAは以下の場合に適しています:

  • 開発した新しい尺度や質問紙の構造を発見したい場合
  • 多数の変数をより少ない因子に縮約したい場合
  • 構造に関する明確な先行理論なしにどの項目がまとまるかを調べたい場合
  • 尺度開発の初期段階で構成概念妥当性を評価したい場合

EFAは本質的に探索的なものです。すでに特定の因子構造を想定しており、それを確認したい場合は、確認的因子分析(CFA)がより適切です。

ステップ1:サンプルサイズの確認

EFAを実行する前に、サンプルが十分に大きいことを確認してください。サンプルが小さいと、再現性のない不安定な因子解が得られます。

サンプルサイズの目安

| ガイドライン | 推奨値 | |-------------|--------| | 最低N | 少なくとも100の観測値 | | N対変数比 | 変数あたり少なくとも5人の参加者 | | 推奨比率 | 変数あたり10人以上の参加者 | | 理想的なN | 安定した解のために300以上 |

例: 調査に15項目がある場合、最低でも75人の参加者(項目あたり5人)が必要ですが、150人以上が強く推奨されます。

ステップ2:データの適合性を評価

すべてのデータセットが因子分析に適しているわけではありません。2つの主要な検定が、相関行列に因子が出現するのに十分な共有分散が含まれているかどうかを判定するのに役立ちます。

Kaiser-Meyer-Olkin(KMO)測度

KMO統計量は0から1の範囲をとり、変数間の偏相関が二変量相関に比べて小さいかどうかを示します。値が高いほど、データは因子分析に適しています。

| KMO値 | 解釈 | |-------|------| | .90以上 | 素晴らしい | | .80 - .89 | 優れている | | .70 - .79 | まあまあ | | .60 - .69 | 凡庸 | | .50 - .59 | 不十分 | | .50未満 | 不適格 - EFAを実行しないこと |

バートレットの球面性検定

バートレット検定は、相関行列が単位行列(すべての非対角相関がゼロの行列)と有意に異なるかどうかを検定します。有意な結果(p < .05)は、相関が因子分析に十分な大きさであることを示します。

両方の条件を満たす必要があります: KMOが.60以上、かつバートレット検定が有意。

ステップ3:抽出法の選択

抽出法は、相関行列から因子をどのように引き出すかを決定します。

| 方法 | 使用する場面 | |------|------------| | 主因子法(PAF) | EFAで最も一般的;共有分散に焦点 | | 最尤法(ML) | データがほぼ正規分布の場合;適合度統計量を提供 | | 主成分分析(PCA) | 厳密には因子分析ではない;固有分散を含む全分散を抽出 |

ほとんどの社会科学研究では、主因子法が推奨されます。データが正規分布で、カイ二乗適合度検定が必要な場合は、最尤法を使用してください。

ステップ4:因子数の決定

保持する因子の数を決定することは、EFAにおいて最も重要かつ困難な決定の一つです。単一のルールに頼るのではなく、複数の基準を使用してください。

カイザー基準(固有値 > 1)

固有値が1.0より大きいすべての因子を保持します。この規則は適用しやすいですが、特に変数が多い場合に因子数を過大評価する傾向があります。

スクリープロット

固有値を降順にプロットし、曲線が急に折れ曲がるポイント(「エルボー」)を探します。エルボーより上の因子を保持します。StatMateの因子分析計算機では、スクリープロットが自動的に生成されます。

平行分析

観測された固有値を、同じサイズのランダムに生成されたデータの固有値と比較します。観測された固有値がランダムな固有値を超える因子を保持します。これは一般的に最も正確な方法と考えられています。

実践例

12の調査項目があり、固有値が以下の通りだとします:

| 因子 | 固有値 | 分散の% | |------|--------|---------| | 1 | 4.21 | 35.1% | | 2 | 2.58 | 21.5% | | 3 | 1.34 | 11.2% | | 4 | 0.89 | 7.4% | | 5 | 0.72 | 6.0% |

カイザー基準は3因子を示唆しています(固有値が1以上)。スクリープロットは因子3の後に明確なエルボーを示しています。平行分析も3因子を支持しています。3つの方法が収束しているため、3因子解に自信を持つことができます。

ステップ5:回転法の選択

回転していない因子解は、項目が複数の因子に負荷する可能性があるため、解釈が困難なことが多いです。回転は分散を再配分し、よりクリーンで解釈しやすい構造を生み出します。

直交回転(バリマックス)

バリマックス回転は、因子間に相関がないことを仮定します。各因子内の因子負荷量の分散を最大化し、高い負荷量をより高く、低い負荷量をより低くします。基底にある次元が互いに独立していると期待される場合にバリマックスを使用してください。

斜交回転(プロマックスまたはダイレクトオブリミン)

斜交回転は因子間の相関を許容します。心理学や社会科学では、基底にある構成概念が完全に独立していることはまれであるため、斜交回転がより現実的であることが多いです。因子間相関が低い場合(.32未満)、斜交解は直交解と非常に類似したものになります。

推奨: まず斜交回転(プロマックス)から始めます。因子間相関がすべて.32未満であれば、より単純な解釈のためにバリマックスに切り替えることができます。

ステップ6:因子負荷量の解釈

抽出と回転の後、因子負荷量行列を確認します。各負荷量は、観測変数と潜在因子の間の相関を表します。

負荷量の解釈ガイドライン

| 負荷量の値 | 解釈 | |-----------|------| | .70以上 | 優秀 | | .55 - .69 | 良好 | | .45 - .54 | まあまあ | | .32 - .44 | 低い(正当な理由があれば保持可能) | | .32未満 | 弱すぎる - 項目の削除を検討 |

交差負荷の処理

2つ以上の因子に実質的に負荷する項目(両方の負荷量が.32以上)は交差負荷項目と呼ばれます。交差負荷項目は、単一の因子に明確に帰属しないため問題となります。選択肢は以下の通りです:

  1. 項目を削除して分析を再実行する
  2. 負荷量の差が少なくとも.20ある場合、最も高い負荷量を持つ因子に割り当てる
  3. 理論的な根拠がある場合、複数の因子への帰属をそのまま保持する

実践例:職務満足度調査

250人の従業員に12項目の職務満足度調査を実施したとします。以下は、プロマックス回転で3因子を抽出した後の回転後因子負荷量行列の簡略例です。

| 項目 | 因子1:仕事内容 | 因子2:報酬 | 因子3:人間関係 | |------|---------------|------------|----------------| | Q1: 仕事にやりがいを感じる | .78 | .08 | .12 | | Q2: 業務が興味深い | .72 | .11 | .05 | | Q3: スキルを効果的に活用している | .68 | .15 | .09 | | Q4: 仕事にチャレンジがある | .61 | .03 | .18 | | Q5: 給与が公正である | .10 | .82 | .06 | | Q6: 福利厚生が適切である | .07 | .74 | .14 | | Q7: 給与が努力に見合っている | .14 | .71 | .09 | | Q8: 昇進の機会がある | .22 | .55 | .18 | | Q9: 同僚とうまくやれている | .11 | .08 | .79 | | Q10: 上司が協力的である | .06 | .12 | .73 | | Q11: チームのコミュニケーションが良好 | .15 | .05 | .69 | | Q12: 職場で尊重されていると感じる | .19 | .16 | .64 |

この解の解釈

  • 因子1(項目Q1-Q4)は、仕事そのものの性質に対する満足度を捉えています。すべての負荷量が.60以上です。
  • 因子2(項目Q5-Q8)は、報酬と昇進に対する満足度を捉えています。負荷量は.55から.82の範囲です。
  • 因子3(項目Q9-Q12)は、対人関係に対する満足度を捉えています。負荷量は.64から.79の範囲です。
  • 問題のある交差負荷を示す項目はありません(すべての交差負荷が.32未満)。
  • 3つの因子を合わせると、全分散の67.8%を説明します。

これは、明確に解釈可能な因子を持つクリーンな解です。

ステップ7:解の評価

因子を解釈した後、解の全体的な質を評価します。

共通性

共通性は、抽出された因子によって各変数の分散がどの程度説明されているかを示します。共通性が.40未満の場合、その変数は他の変数とうまく適合しておらず、削除の候補になる可能性があります。

説明された全分散

社会科学では、全分散の50-60%以上を説明する因子解は一般的に適切と考えられます。

因子間相関(斜交回転の場合)

斜交回転を使用した場合は、因子間相関行列を確認してください。.80を超える相関は、2つの因子が実際には同じ構成概念を測定している可能性があり、統合を検討すべきです。

StatMateで因子分析を実行する

StatMateの因子分析計算機は、EFAプロセス全体を効率化します:

  1. データを入力 - 項目レベルのデータを貼り付けるか、CSVファイルをアップロード
  2. 適合性チェック - StatMateがKMOとバートレット検定を自動計算
  3. スクリープロットを表示 - インタラクティブなプロットでエルボーポイントを特定
  4. 因子と回転を選択 - 因子数と希望する回転法を選択
  5. 負荷量を確認 - 因子負荷量行列が強い負荷量を強調表示し、交差負荷にフラグを立てる
  6. 結果をエクスポート - APA形式の結果をコピーまたはPDFとしてダウンロード

すべての結果に共通性テーブル、説明された全分散、回転後の因子負荷量行列が含まれており、論文にそのまま掲載できる形式でフォーマットされています。

APA形式でのEFA結果の報告

EFAの結果を論文にまとめる際には、以下の要素を含めてください:

  1. サンプルサイズとデータの適合性: N、KMO、バートレット検定を報告
  2. 抽出法と回転: 使用した方法とその理由を記載
  3. 因子数: 因子数を決定するために使用した基準を報告
  4. 因子負荷量: 回転後の因子負荷量行列をテーブルで提示
  5. 説明された分散: 累積パーセンテージを報告
  6. 因子ラベル: 構成項目に基づいて各因子に名前を付ける

記述例:

12の職務満足度項目に対して、主因子法とプロマックス回転を用いて探索的因子分析を実施した。Kaiser-Meyer-Olkin測度はサンプリングの妥当性を確認し、KMO = .84であり、バートレットの球面性検定は有意であった(カイ二乗(66) = 1,842.35, p < .001)。固有値が1.0を超える3因子が抽出され、全分散の67.8%を説明した。回転後の因子解はクリーンな構造を示し、すべての項目が主要因子に.55以上の負荷を示し、.32を超える交差負荷はなかった。

よくある質問

EFAに必要な項目数は?

想定される因子あたり最低3項目が必要ですが、因子あたり4-5項目がより安定した解を提供します。因子あたり3項目未満では、因子の定義が不十分になる可能性があります。

順序データ(リッカート尺度)でEFAを使用できますか?

厳密には、ピアソンベースのEFAは連続データを仮定します。しかし、5段階以上のリッカート尺度は、実務ではおおよそ連続的なものとして扱われるのが一般的です。5段階未満の尺度の場合は、ポリコリック相関の使用を検討してください。

KMOが.60未満の場合はどうすべきですか?

低いKMOは、相関のパターンが因子分析にとって拡散しすぎていることを示します。一部の項目が他の項目とほとんど関連していないかどうかを検討し、それらを削除してからKMOを再評価してください。KMOが低いままの場合、EFAはそのデータに適切でない可能性があります。

PCAとEFAのどちらを使うべきですか?

PCAとEFAはしばしば混同されますが、異なる目的を持っています。PCAはすべての分散(共有分散と固有分散)の合成を作成するデータ縮約技法です。EFAは潜在構成概念を特定するために共有分散を特にモデル化します。尺度開発と理論検証には、EFAが推奨されます。

直交回転と斜交回転のどちらを選ぶべきですか?

デフォルトとして斜交回転を使用してください。得られた因子間相関がすべて.32未満であれば、解は本質的に直交解と同じであるため、簡潔さのために直交版を報告できます。相関が.32を超える場合は、直交性を強制すると真の関係を歪めるため、斜交回転のままにしてください。

項目が交差負荷を示す場合、どうすべきですか?

まず、交差負荷が実質的かどうかを確認します(両方の負荷量が.32以上)。2つの最高負荷量の差が.20以上であれば、より高い負荷量の因子に項目を割り当てます。差が.20未満であれば、項目を削除して分析を再実行することを検討してください。

StatMateで小さなサンプルでEFAを実行できますか?

StatMateはサンプルサイズに関係なく結果を計算しますが、100未満の観測値では因子解が不安定になる可能性があります。StatMateは、サンプルサイズが推奨閾値を下回る場合に警告を表示します。

今すぐ計算してみましょう

StatMateの無料統計計算ツールでデータを分析し、APA形式の結果を取得しましょう。

計算を始める

統計のヒントを受け取る

統計分析、APAフォーマット、新しい計算ツールの更新情報を毎週お届けします。

スパムはありません。いつでも解除できます。