탐색적 요인분석(EFA)을 수행합니다. KMO 검정, Bartlett 구형성 검정, 고유값 분해, 요인 적재량, 공통성을 제공합니다. PCA 및 PAF 추출, Varimax 및 Promax 회전을 지원합니다.
요인분석(Factor Analysis)은 다수의 관측 변수들 사이에 존재하는 상관관계 패턴을 분석하여, 소수의 잠재 변수(latent variable)—즉 요인(factor)—으로 데이터를 축소하고 설명하는 다변량 통계 기법입니다. 설문지 개발, 심리 측정, 구성 타당도 검증, 데이터 차원 축소 등 사회과학 및 행동과학 전반에서 핵심적으로 활용됩니다.
요인분석의 기원은 1904년 영국의 심리학자 Charles Spearman이 지능 검사 점수 간의 양의 상관을 설명하기 위해 일반 지능 요인(g)을 제안한 것으로 거슬러 올라갑니다. 이후 1930년대에 Louis L. Thurstone이 다중 요인 분석법을 발전시켜 단순 구조(simple structure) 개념과 회전(rotation) 기법을 도입함으로써, 현대 요인분석의 토대를 마련했습니다. 오늘날 요인분석은 심리학, 교육학, 마케팅, 의학, 사회학 등 거의 모든 실증 연구 분야에서 필수적인 분석 도구로 자리잡고 있습니다.
요인분석은 크게 두 가지로 구분됩니다: 탐색적 요인분석(EFA, Exploratory Factor Analysis)과 확인적 요인분석(CFA, Confirmatory Factor Analysis). EFA는 데이터의 잠재 구조를 사전 가설 없이 탐색적으로 파악할 때 사용하며, 새로운 측정 도구를 개발하거나 예비 연구에서 변수의 군집 패턴을 발견하는 데 적합합니다. 반면 CFA는 이론적으로 설정한 요인 구조가 실제 데이터에 부합하는지를 검증하는 확인적 절차로, 구조방정식 모형(SEM)의 측정 모형 단계에서 주로 사용됩니다. 이 계산기는 탐색적 요인분석(EFA)을 수행합니다.
요인분석을 사용하기 적합한 상황으로는 다음과 같은 경우가 있습니다: (1) 설문지나 척도를 새로 개발할 때 문항들이 의도한 하위 구성개념에 묶이는지 확인하는 경우, (2) 다수의 변수를 소수의 요인으로 축소하여 후속 분석(회귀분석, 군집분석 등)에 투입하려는 경우, (3) 구성 타당도 (construct validity)를 평가하여 측정 도구의 내적 구조를 검증하는 경우, (4) 변수 간 다중공선성을 해결하기 위해 차원을 축소하는 경우입니다.
요인분석을 수행하기 전에, 수집된 데이터가 요인분석에 적합한지를 먼저 확인해야 합니다. 이를 위해 두 가지 사전 검정을 사용합니다: Kaiser-Meyer-Olkin(KMO) 검정과 Bartlett의 구형성 검정(Bartlett's test of sphericity).
KMO 검정은 변수 쌍 간의 상관이 다른 변수들에 의해 설명될 수 있는 정도를 나타내는 표본 적합도 지수입니다. KMO 값은 0에서 1 사이이며, 값이 높을수록 요인분석에 적합합니다. Kaiser(1974)가 제시한 해석 기준은 다음과 같습니다:
| KMO 값 | 평가 | 해석 |
|---|---|---|
| ≥ .90 | Marvelous (훌륭) | 요인분석에 매우 적합 |
| .80 – .89 | Meritorious (우수) | 요인분석에 적합 |
| .70 – .79 | Middling (보통) | 요인분석 수행 가능 |
| .60 – .69 | Mediocre (미흡) | 주의하여 진행, 변수 재검토 권장 |
| .50 – .59 | Miserable (나쁨) | 요인분석이 거의 부적합 |
| < .50 | Unacceptable (불가) | 요인분석 수행 불가, 변수 재구성 필요 |
Bartlett의 구형성 검정은 상관행렬이 단위행렬(identity matrix)과 같은지를 카이제곱(χ²) 검정으로 확인합니다. 귀무가설은 "모든 변수 간의 상관이 0이다"(즉, 상관행렬 = 단위행렬)입니다. p < .05로 귀무가설이 기각되면 변수들 사이에 유의한 상관이 존재하며, 요인분석을 진행할 수 있습니다. Bartlett 검정이 유의하지 않으면 변수들이 서로 독립적이므로 요인을 추출할 근거가 없습니다.
요인분석에서 가장 많이 사용되는 두 가지 추출 방법은 주성분분석(PCA, Principal Component Analysis)과 주축요인법(PAF, Principal Axis Factoring)입니다. 두 방법은 철학적 배경과 분석 목적이 다릅니다:
| 특성 | PCA (주성분분석) | PAF (주축요인법) |
|---|---|---|
| 철학 | 관측 변수의 총 분산을 최대한 설명하는 성분 추출 | 변수 간 공통 분산만을 설명하는 잠재 요인 추출 |
| 대각 원소 | 상관행렬 대각에 1.0 (총 분산 사용) | 상관행렬 대각에 공통성 추정치 (고유 분산 제외) |
| 분석 목적 | 데이터 축소, 차원 축소 | 잠재 구조 탐색, 구성개념 발견 |
| 사용 시기 | 변수의 총 분산을 요약하고 싶을 때; 후속 분석을 위한 합성 점수가 필요할 때 | 관측 변수 뒤에 있는 잠재 요인의 구조를 밝히고 싶을 때; 측정 오차를 분리하고 싶을 때 |
| 분산 설명 | 총 분산의 100%를 설명 가능 (성분 수 = 변수 수일 때) | 공통 분산만 설명; 고유 분산(unique variance)은 제외 |
참고: 엄밀히 말하면 PCA는 "요인분석"이 아닌 별도의 차원 축소 기법이지만, 실무에서는 요인분석의 추출 방법으로 가장 널리 사용됩니다. 변수 수가 많고 공통성이 높을 때 PCA와 PAF 결과는 매우 유사해집니다.
요인분석에서 가장 중요한 결정 중 하나는 "몇 개의 요인을 추출할 것인가?"입니다. 요인 수를 과다 추출하면 해석이 어려운 사소한 요인이 포함되고, 과소 추출하면 중요한 잠재 구조를 놓칠 수 있습니다. 주로 사용되는 세 가지 기준은 다음과 같습니다:
1. Kaiser 기준 (고유값 > 1 규칙)
Kaiser(1960)가 제안한 이 기준은 고유값(eigenvalue)이 1보다 큰 요인만 추출합니다. 고유값이 1이라는 것은 해당 요인이 적어도 변수 하나만큼의 분산을 설명한다는 의미입니다. 가장 널리 사용되지만, 변수 수가 많을 때 요인을 과다 추출하는 경향이 있어 다른 기준과 함께 사용하는 것이 권장됩니다.
2. 스크리 도표(Scree Plot)
Cattell(1966)이 제안한 스크리 도표는 고유값을 요인 번호 순서대로 그래프에 그려, 고유값이 급격히 감소하다가 완만해지는 "팔꿈치(elbow)" 지점을 찾는 방법입니다. 팔꿈치 지점 왼쪽의 요인 수를 추출합니다. 시각적 판단이 필요하므로 주관적일 수 있으나, 실무에서 Kaiser 기준의 보완으로 매우 유용합니다.
3. 평행 분석(Parallel Analysis)
Horn(1965)이 제안한 평행 분석은 동일한 크기의 무작위 데이터에서 산출된 고유값과 실제 데이터의 고유값을 비교합니다. 실제 고유값이 무작위 기대값보다 큰 요인만 추출합니다. 시뮬레이션 기반으로 가장 정확한 방법으로 평가되며, 최근에는 Kaiser 기준보다 평행 분석이 더 권장되는 추세입니다.
초기 요인 추출 결과는 해석이 어려운 경우가 많습니다. 요인 회전은 요인 적재량의 패턴을 단순화하여 각 변수가 가능한 한 하나의 요인에만 높게 적재되도록 조정하는 과정입니다. 크게 직교 회전(orthogonal rotation)과 사교 회전(oblique rotation)으로 나뉩니다.
| 특성 | Varimax (직교) | Promax (사교) |
|---|---|---|
| 요인 간 상관 | 요인 간 상관을 0으로 가정 (비상관) | 요인 간 상관을 허용 (상관 가능) |
| 행렬 | 요인 적재 행렬 하나만 산출 | 패턴 행렬(pattern matrix)과 구조 행렬(structure matrix) 산출 |
| 해석 | 단순하고 직관적 | 더 복잡하지만 현실적 |
| 사용 시기 | 요인 간 독립성이 이론적으로 지지될 때; 단순한 구조가 필요할 때 | 요인 간 상관이 예상될 때(대부분의 사회과학 변수); 더 현실적인 모형이 필요할 때 |
| 장점 | 해석 용이, 분산 설명 비율 합산 가능 | 요인 간 상관을 반영하여 더 정확한 구조 파악 |
참고: 사교 회전에서 패턴 행렬(pattern matrix)은 다른 요인의 영향을 통제한 후의 고유한 기여를 나타내고, 구조 행렬(structure matrix)은 요인 간 상관을 포함한 전체 상관을 나타냅니다. 요인 해석 시에는 일반적으로 패턴 행렬을 기준으로 합니다. 요인 간 상관이 .32 미만이면 직교 회전(Varimax)을, .32 이상이면 사교 회전(Promax)을 사용하는 것이 일반적인 지침입니다 (Tabachnick & Fidell, 2013).
연구자가 성격 특성을 측정하는 8개 문항(5점 리커트 척도)을 30명의 대학생에게 실시했습니다. 문항은 세 가지 성격 차원—외향성 (Extraversion), 성실성(Conscientiousness), 개방성(Openness)—을 측정하도록 설계되었습니다.
외향성 문항
Q1: 사람들과 어울리는 것을 좋아한다
Q2: 파티에서 활발하게 활동한다
Q3: 새로운 사람을 만나는 것이 즐겁다
성실성 문항
Q4: 일을 체계적으로 계획한다
Q5: 마감일을 잘 지킨다
Q6: 세부사항에 주의를 기울인다
개방성 문항
Q7: 새로운 아이디어에 관심이 많다
Q8: 예술과 창의적 활동을 즐긴다
적합성 검정 결과
KMO = 0.69 (Mediocre—미흡하지만 수행 가능)
Bartlett의 구형성 검정: χ²(28) = 112.45, p < .001
KMO가 .60 이상이고 Bartlett 검정이 유의하므로 요인분석을 진행할 수 있습니다.
고유값(Eigenvalues)과 분산 설명
| 요인 | 고유값 | 분산 비율 (%) | 누적 비율 (%) |
|---|---|---|---|
| 1 | 2.85 | 35.63 | 35.63 |
| 2 | 2.12 | 26.50 | 62.13 |
| 3 | 1.38 | 17.25 | 79.38 |
| 4 | 0.62 | 7.75 | 87.13 |
| 5–8 | < 0.50 | … | 100.00 |
Kaiser 기준(고유값 > 1)에 따라 3개 요인이 추출되며, 전체 분산의 79.38%를 설명합니다.
회전 후 요인 적재량 (Varimax 회전)
| 문항 | 요인 1 (외향성) | 요인 2 (성실성) | 요인 3 (개방성) | 공통성 |
|---|---|---|---|---|
| Q1 | .82 | .11 | .09 | .70 |
| Q2 | .78 | .15 | .13 | .65 |
| Q3 | .75 | .08 | .22 | .62 |
| Q4 | .10 | .85 | .07 | .74 |
| Q5 | .14 | .81 | .12 | .70 |
| Q6 | .09 | .76 | .18 | .62 |
| Q7 | .18 | .12 | .83 | .74 |
| Q8 | .15 | .10 | .79 | .66 |
굵은 파란색 값은 해당 요인에 대한 적재량이 .40 이상인 경우를 나타냅니다. 모든 문항이 의도한 요인에 명확하게 적재되었으며, 교차 적재(cross-loading)가 없는 깨끗한 단순 구조를 보여줍니다.
결과 요약
3개 요인이 추출되었으며 전체 분산의 79.38%를 설명합니다. 요인 1(외향성)은 35.63%, 요인 2(성실성)은 26.50%, 요인 3(개방성)은 17.25%의 분산을 각각 설명합니다. 공통성 (communality) 범위는 .62–.74로, 모든 문항이 추출된 요인에 의해 적절하게 설명되고 있음을 나타냅니다.
요인분석 결과를 해석할 때 주의해야 할 세 가지 핵심 지표가 있습니다:
1. 요인 적재량(Factor Loadings)
요인 적재량은 각 관측 변수와 잠재 요인 사이의 상관계수입니다. 절대값이 클수록 해당 변수가 해당 요인에 강하게 기여합니다. 일반적으로 .40 이상이면 의미 있는 적재로 간주하며, .70 이상이면 강한 적재로 해석합니다. .30 미만의 적재량은 보통 무시합니다. 각 변수가 하나의 요인에만 높게 적재되는 패턴이 이상적입니다.
2. 교차 적재(Cross-Loadings)
교차 적재란 하나의 변수가 두 개 이상의 요인에 .32 이상의 적재량을 보이는 경우를 말합니다. 교차 적재가 있는 문항은 어떤 요인에 귀속시킬지 모호해지므로 해석이 어렵습니다. 이런 문항은 제거하거나 문항 내용을 수정하는 것을 고려해야 합니다. 교차 적재가 많으면 요인 수를 다시 검토하거나 회전 방법을 변경해 볼 필요가 있습니다.
3. 공통성(Communalities)
공통성은 각 변수의 분산 중 추출된 요인들에 의해 설명되는 비율입니다. 값은 0에서 1 사이이며, .40 이상이면 해당 변수가 요인 구조에 잘 포함되어 있음을 의미합니다. 공통성이 매우 낮은 변수(.20 미만)는 어떤 요인과도 관련이 약하므로 분석에서 제외를 고려해야 합니다. PCA에서의 초기 공통성은 항상 1.0이며, PAF에서는 SMC(Squared Multiple Correlation)를 초기 추정치로 사용합니다.
APA 제7판 지침에 따라 요인분석 결과를 보고할 때는 사용한 추출 방법, 회전 방법, 요인 수 결정 기준, KMO 및 Bartlett 검정 결과, 요인 적재량, 분산 설명 비율을 포함해야 합니다. 다음은 풀이 예제를 기반으로 한 보고 템플릿입니다:
보고 예시
8개 성격 문항에 대해 주성분분석(PCA)과 Varimax 직교 회전을 사용한 탐색적 요인분석을 실시하였다. 표본 적합성을 확인하기 위해 Kaiser-Meyer-Olkin 검정을 실시한 결과 KMO = .69로 요인분석에 수용 가능한 수준이었으며, Bartlett의 구형성 검정은 통계적으로 유의하였다, χ²(28) = 112.45, p < .001. Kaiser 기준(고유값 > 1)에 따라 3개 요인이 추출되었으며, 전체 분산의 79.38%를 설명하였다. 요인 1(외향성)은 35.63%, 요인 2(성실성)은 26.50%, 요인 3(개방성)은 17.25%의 분산을 설명하였다. 모든 문항은 의도한 요인에 .75 이상의 적재량으로 명확하게 적재되었으며, 교차 적재는 관찰되지 않았다.
보고 템플릿 (일반형)
[변수 수]개 문항에 대해 [추출 방법]과 [회전 방법] 회전을 사용한 탐색적 요인분석을 실시하였다. KMO = [값], Bartlett의 구형성 검정, χ²([df]) = [값], p [< .001 또는 = 값]. [기준]에 따라 [요인 수]개 요인이 추출되었으며, 전체 분산의 [비율]%를 설명하였다. 요인 적재량은 [범위]이었으며, [교차 적재 유무]였다.
참고: 요인 적재량 표는 본문이 아닌 별도의 표(Table)로 제시하며, .40 미만의 적재량은 표에서 생략하거나 빈칸으로 처리하여 가독성을 높입니다. 통계 기호(χ², p, df)는 이탤릭체로 표기하고, p값은 .001 미만일 때 p < .001로 보고합니다.
StatMate의 요인분석 계산은 R의 psych::fa() 함수와 psych::principal() 함수 및 SPSS Factor Analysis 출력에 대해 교차 검증되었습니다. KMO 검정은 psych::KMO(), Bartlett 검정은 psych::cortest.bartlett()와 동일한 알고리즘을 사용합니다. 고유값, 요인 적재량, 공통성, 분산 설명 비율, 회전 후 적재량 모두 R 및 SPSS 출력과 소수점 4자리 이상 일치합니다. Varimax 회전은 Kaiser 정규화를 적용하며, Promax 회전은 kappa = 4를 기본값으로 사용합니다.
T-검정
두 집단의 평균 비교
분산분석
3개 이상 집단의 평균 비교
카이제곱
범주형 변수의 연관성 검정
상관분석
관계의 강도 측정
기술통계
데이터 요약
표본 크기
검정력 분석 및 표본 계획
일표본 T
알려진 값과 비교
Mann-Whitney U
비모수 집단 비교
Wilcoxon
비모수 대응표본 검정
회귀분석
X-Y 관계 모델링
다중회귀
다중 예측변수 분석
Cronbach's Alpha
척도 신뢰도 분석
로지스틱 회귀
이항 결과 예측
Kruskal-Wallis
비모수 3개 이상 집단 비교
반복측정
피험자 내 분산분석
이원배치 분산분석
요인설계 분석
Friedman 검정
비모수 반복측정
Fisher 정확검정
2×2 분할표 정확 검정
McNemar 검정
대응 명목 데이터 검정
데이터를 입력하고 계산을 클릭하세요
또는 "예시 데이터"를 클릭해 사용해보세요