본문으로 건너뛰기
S
StatMate
블로그 목록
사용 가이드20 min read2026-02-19

탐색적 요인분석(EFA) 실행 방법 — 단계별 가이드

탐색적 요인분석을 처음부터 끝까지 수행하는 방법을 알아봅니다. 데이터 적합성 검사, 요인 추출, 회전, 요인 적재량 해석까지 실제 예제와 함께 단계별로 설명합니다.

탐색적 요인분석이란?

탐색적 요인분석(Exploratory Factor Analysis, EFA)은 여러 개의 관측 변수 뒤에 숨어 있는 잠재적 구조를 발견하기 위한 통계 기법입니다. 설문지 문항이나 측정값이 많을 때, 이 문항들이 몇 개의 하위 차원(요인)으로 묶이는지를 파악할 수 있습니다.

예를 들어, 20개 문항으로 구성된 성격 검사가 실제로는 5개의 잠재적 성격 특성을 측정하고 있을 수 있습니다. EFA는 문항 간 상관관계 패턴을 분석하여 이러한 숨겨진 차원을 식별합니다.

이 가이드는 데이터 적합성 확인부터 최종 요인 해석까지 EFA의 모든 단계를 안내합니다.

언제 EFA를 사용해야 할까?

EFA는 다음과 같은 상황에서 적합합니다.

  • 새로 개발한 척도나 설문지의 구조를 탐색하고 싶을 때
  • 많은 수의 변수를 적은 수의 요인으로 축소하고 싶을 때
  • 사전 이론 없이 어떤 문항들이 함께 묶이는지 확인하고 싶을 때
  • 도구 개발 초기 단계에서 구성 타당도를 평가하고 싶을 때

EFA는 탐색적 성격의 분석입니다. 이미 특정 요인 구조를 가정하고 이를 확인하고자 한다면 확인적 요인분석(CFA)이 더 적합합니다.

1단계: 표본 크기 확인

EFA를 실행하기 전에 충분한 표본 크기를 확보해야 합니다. 작은 표본은 불안정한 요인 해를 산출하여 재현이 어렵습니다.

표본 크기 기준

| 기준 | 권장 사항 | |------|----------| | 최소 N | 100명 이상 | | N 대 변수 비율 | 변수당 최소 5명 | | 권장 비율 | 변수당 10명 이상 | | 이상적 N | 300명 이상 |

예시: 설문지가 15개 문항으로 구성되어 있다면, 최소 75명(문항당 5명)이 필요하지만 150명 이상이 강력히 권장됩니다.

2단계: 데이터 적합성 평가

모든 데이터가 요인분석에 적합한 것은 아닙니다. 두 가지 핵심 검정으로 상관행렬에 요인이 추출될 만큼 충분한 공유 분산이 있는지 확인합니다.

Kaiser-Meyer-Olkin(KMO) 측도

KMO 통계량은 0에서 1 사이의 값을 가지며, 변수 간 편상관이 이변량 상관에 비해 작은지를 나타냅니다. 값이 높을수록 요인분석에 적합합니다.

| KMO 값 | 해석 | |--------|------| | .90 이상 | 매우 우수 | | .80 ~ .89 | 우수 | | .70 ~ .79 | 보통 | | .60 ~ .69 | 미흡하지만 허용 | | .50 ~ .59 | 좋지 않음 | | .50 미만 | 부적합 — EFA 실행 불가 |

바틀렛(Bartlett) 구형성 검정

바틀렛 검정은 상관행렬이 단위행렬(모든 비대각 상관이 0인 행렬)과 유의하게 다른지를 검정합니다. 유의한 결과(p < .05)는 상관이 요인분석을 수행하기에 충분히 크다는 것을 의미합니다.

두 조건 모두 충족되어야 합니다: KMO .60 이상, 바틀렛 검정 유의.

3단계: 추출 방법 선택

추출 방법은 상관행렬에서 요인을 추출하는 방식을 결정합니다.

| 방법 | 사용 시점 | |------|----------| | 주축 요인법(PAF) | EFA에서 가장 일반적; 공유 분산에 초점 | | 최대우도법(ML) | 데이터가 대략 정규분포일 때; 적합도 통계량 제공 | | 주성분 분석(PCA) | 엄밀히는 요인분석이 아님; 고유 분산을 포함한 총 분산 추출 |

대부분의 사회과학 연구에서는 주축 요인법이 권장됩니다. 데이터가 정규분포를 따르고 카이제곱 적합도 검정이 필요하면 최대우도법을 사용하세요.

4단계: 요인 수 결정

몇 개의 요인을 추출할지 결정하는 것은 EFA에서 가장 중요하면서도 어려운 판단입니다. 단일 기준에 의존하지 말고 여러 기준을 종합적으로 사용하세요.

카이저 기준 (고유값 > 1)

고유값이 1보다 큰 모든 요인을 추출합니다. 적용이 쉽지만, 특히 변수 수가 많을 때 요인 수를 과대추정하는 경향이 있습니다.

스크리 도표(Scree Plot)

고유값을 내림차순으로 그래프에 표시하고, 곡선이 급격히 꺾이는 지점("팔꿈치")을 찾습니다. 팔꿈치 위의 요인을 추출합니다. StatMate의 요인분석 계산기에서 스크리 도표가 자동으로 생성됩니다.

평행분석(Parallel Analysis)

관측된 고유값을 동일한 크기의 무작위 생성 데이터에서 얻은 고유값과 비교합니다. 관측 고유값이 무작위 고유값을 초과하는 요인만 추출합니다. 일반적으로 가장 정확한 방법으로 간주됩니다.

실제 예시

12개 설문 문항이 있고 고유값이 다음과 같다고 가정합니다.

| 요인 | 고유값 | 설명 분산(%) | |------|--------|-------------| | 1 | 4.21 | 35.1% | | 2 | 2.58 | 21.5% | | 3 | 1.34 | 11.2% | | 4 | 0.89 | 7.4% | | 5 | 0.72 | 6.0% |

카이저 기준은 3개 요인을 제안합니다(고유값 1 초과). 스크리 도표에서도 요인 3 이후 명확한 팔꿈치가 보입니다. 평행분석 역시 3개 요인을 지지합니다. 세 방법 모두 일치하므로 3요인 해에 대한 확신을 가질 수 있습니다.

5단계: 회전 방법 선택

비회전 요인 해는 문항이 여러 요인에 동시에 적재되어 해석이 어려운 경우가 많습니다. 회전은 분산을 재분배하여 더 깔끔하고 해석 가능한 구조를 만들어 줍니다.

직교 회전 (Varimax)

Varimax 회전은 요인 간 상관이 없다고 가정합니다. 각 요인 내에서 적재량의 분산을 최대화하여, 높은 적재량은 더 높게, 낮은 적재량은 더 낮게 만듭니다. 하위 차원이 서로 독립적일 것으로 예상될 때 사용합니다.

사각 회전 (Promax 또는 Direct Oblimin)

사각 회전은 요인 간 상관을 허용합니다. 심리학과 사회과학에서 잠재 구성개념은 완전히 독립적인 경우가 드물기 때문에, 사각 회전이 더 현실적인 경우가 많습니다. 요인 상관이 낮게 나오면(.32 미만) 사각 해는 직교 해와 매우 유사합니다.

권장: 사각 회전(Promax)으로 시작하세요. 요인 상관이 모두 .32 미만이면 더 간단한 해석을 위해 Varimax로 전환할 수 있습니다.

6단계: 요인 적재량 해석

추출과 회전 후 요인 적재량 행렬을 살펴봅니다. 각 적재량은 관측 변수와 잠재 요인 사이의 상관을 나타냅니다.

적재량 해석 기준

| 적재량 값 | 해석 | |----------|------| | .70 이상 | 매우 우수 | | .55 ~ .69 | 우수 | | .45 ~ .54 | 보통 | | .32 ~ .44 | 미흡하지만 근거가 있으면 유지 가능 | | .32 미만 | 너무 약함 — 문항 제거 고려 |

교차적재(Cross-Loading) 처리

한 문항이 두 개 이상의 요인에 상당한 수준으로 적재되는 경우(두 적재량 모두 .32 이상) 교차적재 문항이라 합니다. 교차적재 문항은 하나의 요인에 명확하게 속하지 않아 문제가 됩니다. 선택지는 다음과 같습니다.

  1. 문항을 제거하고 분석을 다시 실행
  2. 두 적재량의 차이가 .20 이상이면, 더 높은 적재량을 보이는 요인에 할당
  3. 이론적 근거가 있다면 여러 요인에 걸쳐 유지

실제 예제: 직무 만족도 설문

250명의 직원에게 12개 문항의 직무 만족도 설문을 실시했다고 가정합니다. Promax 회전으로 3개 요인을 추출한 후의 회전된 요인 적재량 행렬 예시입니다.

| 문항 | 요인 1: 업무 내용 | 요인 2: 보상 | 요인 3: 대인관계 | |------|-----------------|-------------|----------------| | Q1: 내 업무는 의미 있다 | .78 | .08 | .12 | | Q2: 업무가 흥미롭다 | .72 | .11 | .05 | | Q3: 역량을 효과적으로 활용한다 | .68 | .15 | .09 | | Q4: 업무가 도전적이다 | .61 | .03 | .18 | | Q5: 급여가 공정하다 | .10 | .82 | .06 | | Q6: 복리후생이 적절하다 | .07 | .74 | .14 | | Q7: 급여가 노력을 반영한다 | .14 | .71 | .09 | | Q8: 승진 기회가 있다 | .22 | .55 | .18 | | Q9: 동료와 잘 지낸다 | .11 | .08 | .79 | | Q10: 상사가 지지적이다 | .06 | .12 | .73 | | Q11: 팀 의사소통이 원활하다 | .15 | .05 | .69 | | Q12: 존중받는 느낌이다 | .19 | .16 | .64 |

해 해석

  • 요인 1(Q1-Q4): 업무 자체의 성격에 대한 만족도. 모든 적재량이 .60 이상입니다.
  • 요인 2(Q5-Q8): 보상과 승진에 대한 만족도. 적재량 범위 .55 ~ .82입니다.
  • 요인 3(Q9-Q12): 대인관계에 대한 만족도. 적재량 범위 .64 ~ .79입니다.
  • 문제가 되는 교차적재가 없습니다(모든 교차적재 .32 미만).
  • 세 요인이 총 분산의 67.8%를 설명합니다.

깔끔하고 해석 가능한 요인 해입니다.

7단계: 해 평가

요인을 해석한 후 전반적인 해의 품질을 평가합니다.

공통성(Communalities)

공통성은 각 변수 분산 중 추출된 요인에 의해 설명되는 비율을 나타냅니다. 공통성이 .40 미만이면 해당 변수가 다른 변수들과 잘 맞지 않으며, 제거 후보가 될 수 있습니다.

총 설명 분산

사회과학에서는 요인 해가 총 분산의 50-60% 이상을 설명하면 일반적으로 적절한 것으로 간주됩니다.

요인 간 상관 (사각 회전 시)

사각 회전을 사용한 경우 요인 상관 행렬을 확인합니다. 상관이 .80을 초과하면 두 요인이 실제로 같은 구성개념을 측정하고 있을 수 있으며, 통합을 고려해야 합니다.

StatMate에서 요인분석 실행하기

StatMate의 요인분석 계산기는 EFA 전체 과정을 간소화합니다.

  1. 데이터 입력 — 문항별 데이터를 붙여넣거나 CSV 파일을 업로드합니다
  2. 적합성 검사 — KMO와 바틀렛 검정을 자동으로 계산합니다
  3. 스크리 도표 확인 — 대화형 도표로 팔꿈치 지점을 쉽게 식별할 수 있습니다
  4. 요인 수와 회전 선택 — 요인 수와 원하는 회전 방법을 선택합니다
  5. 적재량 확인 — 요인 적재량 행렬에서 강한 적재량을 강조하고 교차적재를 표시합니다
  6. 결과 내보내기 — APA 형식 결과를 복사하거나 PDF로 다운로드합니다

모든 결과에 공통성 표, 총 설명 분산, 회전된 요인 적재량 행렬이 포함되어 논문에 바로 삽입할 수 있는 형태로 제공됩니다.

APA 형식으로 EFA 결과 보고하기

EFA 결과를 작성할 때 다음 요소를 포함하세요.

  1. 표본 크기 및 데이터 적합성: N, KMO, 바틀렛 검정 보고
  2. 추출 방법 및 회전: 사용한 방법과 이유를 기술
  3. 요인 수: 요인 수 결정에 사용한 기준 보고
  4. 요인 적재량: 회전된 요인 적재량 행렬을 표로 제시
  5. 설명 분산: 누적 비율 보고
  6. 요인 명명: 구성 문항에 기반하여 각 요인에 이름 부여

보고 예시:

12개 직무 만족도 문항에 대해 주축 요인법과 Promax 회전을 사용하여 탐색적 요인분석을 실시하였다. KMO = .84로 표집 적합도가 확인되었으며, 바틀렛 구형성 검정이 유의하였다, chi-square(66) = 1,842.35, p < .001. 고유값 1.0을 초과하는 3개 요인이 추출되었으며, 총 분산의 67.8%를 설명하였다. 회전된 요인 해는 모든 문항이 주 요인에 .55 이상으로 적재되고 교차적재가 .32를 초과하지 않는 깔끔한 구조를 보였다.

자주 묻는 질문

EFA에 문항이 몇 개 필요한가요?

요인당 최소 3개 문항이 필요하지만, 요인당 4-5개 문항이 더 안정적인 해를 제공합니다. 요인당 문항이 3개 미만이면 해당 요인이 잘 정의되지 않을 수 있습니다.

서열 데이터(리커트 척도)로 EFA를 할 수 있나요?

엄밀히 말하면 Pearson 기반 EFA는 연속형 데이터를 가정합니다. 그러나 5점 이상의 리커트 척도는 실무에서 근사적으로 연속형으로 처리되는 경우가 많습니다. 5점 미만의 척도에서는 다분상관(polychoric correlation)을 사용하는 것을 고려하세요.

KMO가 .60 미만이면 어떻게 하나요?

낮은 KMO는 상관 패턴이 요인분석을 수행하기에 너무 분산되어 있음을 나타냅니다. 다른 문항과 관련이 적은 문항이 있는지 확인하고 제거한 후 KMO를 재평가하세요. KMO가 여전히 낮으면 해당 데이터에 EFA가 적합하지 않을 수 있습니다.

PCA와 EFA 중 어떤 것을 사용해야 하나요?

PCA와 EFA는 종종 혼동되지만 목적이 다릅니다. PCA는 공유 분산과 고유 분산을 모두 포함하는 합성변수를 만드는 데이터 축소 기법입니다. EFA는 잠재 구성개념을 식별하기 위해 공유 분산만을 모형화합니다. 도구 개발과 이론 검증에는 EFA가 선호됩니다.

직교 회전과 사각 회전 중 어떤 것을 선택하나요?

사각 회전을 기본값으로 사용하세요. 결과적 요인 상관이 모두 .32 미만이면, 해가 본질적으로 직교 해와 동일하므로 간결한 해석을 위해 직교 버전을 보고할 수 있습니다. 상관이 .32를 초과하면 직교성을 강제하는 것이 실제 관계를 왜곡할 수 있으므로 사각 회전을 유지하세요.

문항에 교차적재가 있으면 어떻게 하나요?

먼저 교차적재가 실질적인지 확인합니다(두 적재량 모두 .32 이상). 두 개의 가장 높은 적재량 차이가 .20 이상이면 더 높은 적재량의 요인에 할당합니다. 차이가 .20 미만이면 해당 문항을 제거하고 분석을 다시 실행하는 것을 고려하세요.

StatMate에서 소규모 표본으로 EFA를 실행할 수 있나요?

StatMate는 표본 크기에 관계없이 결과를 계산하지만, 100명 미만의 관측치에서는 요인 해가 불안정할 수 있습니다. StatMate는 표본 크기가 권장 기준 이하일 때 경고를 표시합니다.

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.