KMO検定、バートレット検定、固有値分解、因子負荷量、共通性を含む探索的因子分析(EFA)を実施します。主成分分析(PCA)と主因子法(PAF)の抽出、バリマックスおよびプロマックス回転に対応。
因子分析(Factor Analysis)は、多数の観測変数間に存在する相関パターンを 分析し、少数の潜在変数(latent variable)—すなわち因子(factor)—でデータを縮約・説明する多変量 統計手法です。質問紙の開発、心理測定、構成概念妥当性の検証、データの 次元縮約など、社会科学および行動科学の幅広い分野で不可欠な手法として 活用されています。
因子分析の起源は、1904年にイギリスの心理学者Charles Spearmanが知能検査得点間の正の相関を説明する ために一般知能因子(g)を提唱したことに遡ります。その後1930年代にLouis L. Thurstoneが多因子分析法を発展させ、単純構造 (simple structure)の概念と回転(rotation)の技法を導入することで、 現代の因子分析の基礎を築きました。今日、因子分析は心理学、教育学、 マーケティング、医学、社会学など、ほぼすべての実証研究分野で必須の 分析手法となっています。
因子分析は大きく2種類に分けられます: 探索的因子分析(EFA, Exploratory Factor Analysis)と 確認的因子分析(CFA, Confirmatory Factor Analysis)です。 EFAはデータの潜在構造を事前の仮説なしに探索的に把握する際に使用され、 新しい測定尺度の開発や予備的研究で変数のクラスタリングパターンを発見する のに適しています。一方、CFAは理論的に設定した因子構造が実際のデータに 適合するかを検証する確認的な手続きであり、構造方程式モデリング(SEM)の 測定モデル段階で主に使用されます。この計算機は 探索的因子分析(EFA)を実行します。
因子分析の使用が適切な場面としては、以下のようなケースがあります:(1) 質問紙や尺度を新たに開発する際、項目が意図した下位構成概念にまとまるか 確認する場合、(2) 多数の変数を少数の因子に縮約し後続の分析(回帰分析、 クラスター分析など)に投入する場合、(3) 構成概念妥当性(construct validity)を評価し測定尺度の内部構造を検証する場合、(4) 変数間の 多重共線性を解消するために次元を縮約する場合です。
因子分析を実施する前に、収集したデータが因子分析に適しているかを確認 する必要があります。そのために2つの事前検定を使用します: Kaiser-Meyer-Olkin(KMO)検定と Bartlettの球面性検定(Bartlett's test of sphericity)です。
KMO検定は、変数ペア間の相関が他の変数によって説明 できる程度を示す標本妥当性の指標です。KMO値は0から1の間であり、値が 高いほど因子分析に適しています。Kaiser(1974)が提示した解釈基準は 以下の通りです:
| KMO値 | 評価 | 解釈 |
|---|---|---|
| ≥ .90 | Marvelous(素晴らしい) | 因子分析に非常に適合 |
| .80 – .89 | Meritorious(優秀) | 因子分析に適合 |
| .70 – .79 | Middling(普通) | 因子分析の実施が可能 |
| .60 – .69 | Mediocre(不十分) | 注意して進行、変数の見直しを推奨 |
| .50 – .59 | Miserable(不良) | 因子分析にはほぼ不適合 |
| < .50 | Unacceptable(不可) | 因子分析の実施不可、変数の再構成が必要 |
Bartlettの球面性検定は、相関行列が単位行列(identity matrix)と等しいかをカイ二乗(χ²)検定で確認します。帰無仮説は "すべての変数間の相関が0である"(すなわち、相関行列 = 単位行列) です。p < .05で帰無仮説が棄却されれば、変数間に有意な相関が 存在し、因子分析を進めることができます。Bartlett検定が有意でなければ、 変数が互いに独立であるため因子を抽出する根拠がありません。
因子分析で最もよく使用される2つの抽出方法は、 主成分分析(PCA, Principal Component Analysis)と 主因子法(PAF, Principal Axis Factoring)です。 両手法は哲学的背景と分析目的が異なります:
| 特性 | PCA(主成分分析) | PAF(主因子法) |
|---|---|---|
| 哲学 | 観測変数の総分散を最大限に説明する成分を抽出 | 変数間の共通分散のみを説明する潜在因子を抽出 |
| 対角要素 | 相関行列の対角に1.0(総分散を使用) | 相関行列の対角に共通性推定値(固有分散を除外) |
| 分析目的 | データ縮約、次元縮約 | 潜在構造の探索、構成概念の発見 |
| 使用場面 | 変数の総分散を要約したい場合;後続分析のための合成得点が 必要な場合 | 観測変数の背後にある潜在因子の構造を明らかにしたい場合; 測定誤差を分離したい場合 |
| 分散の説明 | 総分散の100%を説明可能(成分数 = 変数数の場合) | 共通分散のみを説明;固有分散(unique variance)は除外 |
注:厳密にはPCAは"因子分析"ではなく別の次元縮約手法ですが、 実務では因子分析の抽出方法として最も広く使用されています。変数数が多く 共通性が高い場合、PCAとPAFの結果は非常に類似します。
因子分析において最も重要な決定の1つは、"何個の因子を抽出するか" です。因子を過剰に抽出すると解釈困難な些末な因子が含まれ、過少に抽出 すると重要な潜在構造を見逃す可能性があります。主に使用される3つの基準は 以下の通りです:
1. Kaiser基準(固有値 > 1 ルール)
Kaiser(1960)が提案したこの基準は、固有値(eigenvalue)が1より大きい 因子のみを抽出します。固有値が1であることは、その因子が少なくとも変数 1つ分の分散を説明していることを意味します。最も広く使用されていますが、 変数数が多い場合に因子を過剰抽出する傾向があるため、他の基準と併用 することが推奨されます。
2. スクリープロット(Scree Plot)
Cattell(1966)が提案したスクリープロットは、固有値を因子番号の順に グラフにプロットし、固有値が急激に減少した後に緩やかになる "肘(elbow)"の地点を探す方法です。肘の地点の左側の 因子数を抽出します。視覚的な判断が必要なため主観的になり得ますが、 実務ではKaiser基準の補完として非常に有用です。
3. 平行分析(Parallel Analysis)
Horn(1965)が提案した平行分析は、同一サイズのランダムデータから 算出された固有値と実際のデータの固有値を比較します。実際の固有値が ランダムな期待値より大きい因子のみを抽出します。シミュレーションに 基づく最も正確な方法と評価されており、近年ではKaiser基準よりも 平行分析が推奨される傾向にあります。
初期の因子抽出結果は解釈が困難な場合が多くあります。因子回転は因子 負荷量のパターンを単純化し、各変数がなるべく1つの因子にのみ高く負荷 するよう調整する過程です。大きく 直交回転(orthogonal rotation)と 斜交回転(oblique rotation)に分けられます。
| 特性 | Varimax(直交) | Promax(斜交) |
|---|---|---|
| 因子間の相関 | 因子間相関を0と仮定(無相関) | 因子間相関を許容(相関あり) |
| 行列 | 因子負荷行列を1つのみ算出 | パターン行列(pattern matrix)と構造行列(structure matrix)を算出 |
| 解釈 | 単純で直感的 | より複雑だが現実的 |
| 使用場面 | 因子間の独立性が理論的に支持される場合;単純な構造が必要な場合 | 因子間の相関が想定される場合(社会科学の変数の大半);より 現実的なモデルが必要な場合 |
| 利点 | 解釈が容易、分散説明割合の合算が可能 | 因子間相関を反映しより正確な構造把握が可能 |
注:斜交回転におけるパターン行列(pattern matrix)は 他の因子の影響を統制した後の固有の寄与を表し、 構造行列(structure matrix)は因子間相関を含む全体の 相関を表します。因子の解釈には一般的にパターン行列を基準とします。 因子間相関が.32未満であれば直交回転(Varimax)を、.32以上であれば 斜交回転(Promax)を使用するのが一般的なガイドラインです (Tabachnick & Fidell, 2013)。
研究者が性格特性を測定する8つの項目(5件法リッカート尺度)を30名の 大学生に実施しました。項目は3つの性格次元—外向性 (Extraversion)、誠実性(Conscientiousness)、開放性(Openness)—を 測定するよう設計されています。
外向性項目
Q1: 人と交流するのが好きだ
Q2: パーティーで積極的に活動する
Q3: 新しい人に会うのが楽しい
誠実性項目
Q4: 仕事を体系的に計画する
Q5: 締め切りをよく守る
Q6: 細部に注意を払う
開放性項目
Q7: 新しいアイデアに関心が高い
Q8: 芸術や創造的な活動を楽しむ
適合性検定結果
KMO = 0.69(Mediocre—不十分だが実施可能)
Bartlettの球面性検定: χ²(28) = 112.45、p < .001
KMOが.60以上でBartlett検定が有意であるため、因子分析を進めることが できます。
固有値(Eigenvalues)と分散説明
| 因子 | 固有値 | 分散割合 (%) | 累積割合 (%) |
|---|---|---|---|
| 1 | 2.85 | 35.63 | 35.63 |
| 2 | 2.12 | 26.50 | 62.13 |
| 3 | 1.38 | 17.25 | 79.38 |
| 4 | 0.62 | 7.75 | 87.13 |
| 5–8 | < 0.50 | … | 100.00 |
Kaiser基準(固有値 > 1)に従い3つの因子が抽出され、全分散の 79.38%を説明しています。
回転後の因子負荷量(Varimax回転)
| 項目 | 因子1(外向性) | 因子2(誠実性) | 因子3(開放性) | 共通性 |
|---|---|---|---|---|
| Q1 | .82 | .11 | .09 | .70 |
| Q2 | .78 | .15 | .13 | .65 |
| Q3 | .75 | .08 | .22 | .62 |
| Q4 | .10 | .85 | .07 | .74 |
| Q5 | .14 | .81 | .12 | .70 |
| Q6 | .09 | .76 | .18 | .62 |
| Q7 | .18 | .12 | .83 | .74 |
| Q8 | .15 | .10 | .79 | .66 |
太字の青色の値は、当該因子への負荷量が.40以上の場合を示しています。 すべての項目が意図した因子に明確に負荷しており、交差負荷 (cross-loading)のないクリーンな単純構造を示しています。
結果要約
3つの因子が抽出され、全分散の79.38%を説明しています。 因子1(外向性)は35.63%、因子2(誠実性)は26.50%、因子3(開放性)は 17.25%の分散をそれぞれ説明しています。共通性(communality)の範囲は .62–.74であり、すべての項目が抽出された因子によって適切に 説明されていることを示しています。
因子分析の結果を解釈する際に注意すべき3つの核心的な指標があります:
1. 因子負荷量(Factor Loadings)
因子負荷量は各観測変数と潜在因子の間の相関係数です。絶対値が大きい ほど、その変数が当該因子に強く寄与しています。一般的に.40以上で意味のある負荷と見なし、.70以上で強い負荷と 解釈します。.30未満の負荷量は通常無視します。各変数が1つの因子にのみ 高く負荷するパターンが理想的です。
2. 交差負荷(Cross-Loadings)
交差負荷とは、1つの変数が2つ以上の因子に.32以上の負荷量を示す場合を 指します。交差負荷がある項目はどの因子に帰属させるか曖昧になるため、 解釈が困難になります。このような項目は削除するか、項目内容を修正する ことを検討する必要があります。交差負荷が多い場合は、因子数を再検討 するか回転方法を変更する必要があります。
3. 共通性(Communalities)
共通性は各変数の分散のうち、抽出された因子によって説明される割合です。 値は0から1の間であり、.40以上であればその変数が因子構造に十分含まれて いることを意味します。共通性が非常に低い変数(.20未満)はどの因子とも 関連が弱いため、分析からの除外を検討する必要があります。PCAでの 初期共通性は常に1.0であり、PAFではSMC(Squared Multiple Correlation)を 初期推定値として使用します。
APA第7版ガイドラインに従い因子分析の結果を報告する際は、使用した抽出方法、 回転方法、因子数決定基準、KMOおよびBartlett検定結果、因子負荷量、分散 説明割合を含める必要があります。以下は計算例に基づく報告テンプレートです:
報告例
8つの性格項目に対して主成分分析(PCA)とVarimax直交回転を用いた 探索的因子分析を実施した。標本妥当性を確認するためにKaiser-Meyer-Olkin 検定を行った結果、KMO = .69で因子分析に許容可能な水準であり、 Bartlettの球面性検定は統計的に有意であった、χ²(28) = 112.45、p < .001。 Kaiser基準(固有値 > 1)に従い3つの因子が抽出され、全分散の 79.38%を説明した。因子1(外向性)は35.63%、因子2(誠実性)は 26.50%、因子3(開放性)は17.25%の分散を説明した。すべての項目は 意図した因子に.75以上の負荷量で明確に負荷しており、交差負荷は 観察されなかった。
報告テンプレート(一般形)
[変数数]個の項目に対して[抽出方法]と[回転方法]回転を用いた 探索的因子分析を実施した。KMO = [値]、Bartlettの球面性検定、 χ²([df]) = [値]、p [< .001 または = 値]。[基準]に従い[因子数]個の因子が抽出され、 全分散の[割合]%を説明した。因子負荷量は[範囲]であり、 [交差負荷の有無]であった。
注:因子負荷量表は本文ではなく別の表(Table)として提示し、.40未満の 負荷量は表から省略するか空欄にして可読性を高めます。統計記号 (χ²、p、df)はイタリック体で 表記し、p値が.001未満の場合はp < .001と 報告します。
StatMateの因子分析計算は、Rの psych::fa() 関数および psych::principal() 関数、ならびにSPSS Factor Analysisの出力との交差検証が行われています。 KMO検定は psych::KMO()、 Bartlett検定は psych::cortest.bartlett()と同一のアルゴリズムを使用しています。固有値、因子負荷量、共通性、 分散説明割合、回転後の負荷量はすべてRおよびSPSSの出力と小数第4位 以上で一致しています。Varimax回転はKaiser正規化を適用し、Promax回転は kappa = 4をデフォルト値として使用しています。
t検定
2群の平均値を比較
分散分析
3群以上の平均値を比較
カイ二乗検定
カテゴリ変数の関連を検定
相関分析
関係の強さを測定
記述統計
データを要約
サンプルサイズ
検出力分析・標本計画
1標本t検定
既知の値との比較
マン・ホイットニーU
ノンパラメトリック群間比較
ウィルコクソン検定
ノンパラメトリック対応検定
回帰分析
X-Yの関係をモデル化
重回帰分析
複数の予測変数
クロンバックのα
尺度の信頼性
ロジスティック回帰
二値アウトカムの予測
クラスカル・ウォリス
ノンパラメトリック3群以上比較
反復測定
被験者内分散分析
二元配置分散分析
要因計画の分析
フリードマン検定
ノンパラメトリック反復測定
フィッシャーの正確検定
2×2表の正確検定
マクネマー検定
対応のある名義データの検定
データを入力して「計算」をクリックしてください
または「サンプルデータを読み込む」をクリックしてお試しください