본문으로 건너뛰기
S
StatMate
블로그 목록
사용 가이드20 min read2026-02-19

T검정 실행 방법 — 단계별 가이드 (독립표본 & 대응표본)

독립표본 t검정과 대응표본 t검정을 단계별로 수행하는 방법을 알아봅니다. 가정 검토부터 효과 크기 해석까지, 실제 데이터 예제와 함께 설명합니다.

소개

T검정(t-test)은 두 집단의 평균을 비교하기 위해 가장 많이 사용되는 통계 기법 중 하나입니다. 실험군과 대조군의 차이를 검증하거나, 처치 전후의 변화를 평가할 때 활용됩니다.

T검정에는 크게 두 가지 유형이 있습니다:

  • 독립표본 t검정(Independent Samples T-Test): 서로 다른 두 집단의 평균을 비교합니다. 예를 들어, 남성과 여성의 시험 점수 차이를 분석할 때 사용합니다.
  • 대응표본 t검정(Paired Samples T-Test): 동일한 집단을 두 번 측정한 값의 평균 차이를 검정합니다. 예를 들어, 프로그램 참여 전후의 체중 변화를 분석할 때 사용합니다.

이 가이드에서는 두 가지 t검정 모두를 실제 데이터와 함께 단계별로 수행합니다. StatMate의 T검정 계산기를 사용하면 여러분의 데이터로 바로 분석을 실행할 수 있습니다.

독립표본 t검정과 대응표본 t검정의 비교

| 특성 | 독립표본 t검정 | 대응표본 t검정 | |----------------------|----------------------------------|-----------------------------------| | 비교 대상 | 서로 다른 두 집단 | 동일 집단의 두 측정값 | | 데이터 구조 | 각 집단이 별도의 참가자 | 같은 참가자가 두 조건에 참여 | | 귀무가설 | 두 집단의 모평균이 같다 | 차이값의 모평균이 0이다 | | 정규성 가정 | 각 집단 내 정규분포 | 차이값의 정규분포 | | 등분산 가정 | 필요 (또는 Welch 보정) | 해당 없음 | | 검정 통계량 | t = (M1-M2) / SE | t = Md / SE | | 자유도 | n1 + n2 - 2 (또는 Welch df) | n - 1 | | 효과 크기 | Cohen's d | Cohen's d (paired) | | 비모수 대안 | Mann-Whitney U 검정 | Wilcoxon 부호순위 검정 |

제1부: 독립표본 t검정

연구 시나리오

한 교육 연구자가 새로운 교수법(실험군)과 전통적 교수법(대조군)의 효과를 비교하려 합니다. 각 집단 12명의 학생이 동일한 시험을 치렀습니다.

예제 데이터

| 학생 | 실험군 점수 | 학생 | 대조군 점수 | |------|------------|------|------------| | 1 | 85 | 13 | 78 | | 2 | 92 | 14 | 72 | | 3 | 88 | 15 | 75 | | 4 | 79 | 16 | 80 | | 5 | 95 | 17 | 68 | | 6 | 83 | 18 | 74 | | 7 | 90 | 19 | 77 | | 8 | 87 | 20 | 71 | | 9 | 91 | 21 | 76 | | 10 | 84 | 22 | 73 | | 11 | 86 | 23 | 79 | | 12 | 93 | 24 | 69 |

기술통계

| 집단 | n | 평균 | 표준편차 | 최솟값 | 최댓값 | |--------|-----|--------|---------|--------|--------| | 실험군 | 12 | 87.75 | 4.56 | 79 | 95 | | 대조군 | 12 | 74.33 | 3.87 | 68 | 80 |

평균 차이는 87.75 - 74.33 = 13.42점입니다.

1단계: 가정 확인

정규성 검정 (Shapiro-Wilk)

| 집단 | W 통계량 | p-값 | |--------|---------|-------| | 실험군 | 0.961 | 0.795 | | 대조군 | 0.954 | 0.712 |

두 집단 모두 p-값이 0.05보다 크므로, 정규성 가정이 충족됩니다.

등분산 검정 (Levene's Test)

| F 통계량 | df1 | df2 | p-값 | |---------|-----|-----|-------| | 0.523 | 1 | 22 | 0.477 |

p-값이 0.477로 0.05보다 크므로, 등분산 가정이 충족됩니다. Student의 t검정을 사용할 수 있습니다.

등분산이 충족되지 않으면? Welch의 t검정을 사용합니다. Welch 검정은 등분산을 가정하지 않으며, 자유도를 보정합니다. 대부분의 통계 소프트웨어에서 기본 옵션으로 제공됩니다.

2단계: 가설 설정

  • 귀무가설(H0): 실험군과 대조군의 평균 점수에 차이가 없다 (mu1 = mu2).
  • 대립가설(H1): 실험군과 대조군의 평균 점수에 차이가 있다 (mu1 != mu2).

유의수준: alpha = 0.05 (양측검정)

3단계: t 통계량 계산

합동 분산(pooled variance):

Sp^2 = [(n1-1)*S1^2 + (n2-1)*S2^2] / (n1 + n2 - 2)

Sp^2 = [(11)(20.79) + (11)(14.97)] / 22

Sp^2 = [228.69 + 164.67] / 22 = 393.36 / 22 = 17.88

Sp = 4.229

표준오차(SE):

SE = Sp * sqrt(1/n1 + 1/n2) = 4.229 * sqrt(1/12 + 1/12) = 4.229 * 0.4082 = 1.726

t 통계량:

t = (M1 - M2) / SE = (87.75 - 74.33) / 1.726 = 13.42 / 1.726 = 7.77

자유도: df = n1 + n2 - 2 = 12 + 12 - 2 = 22

4단계: 결과 해석

| 통계량 | 값 | |---------------------|-------------| | t | 7.77 | | 자유도 (df) | 22 | | p-값 (양측) | < 0.001 | | 평균 차이 | 13.42점 | | 95% 신뢰구간 | [9.84, 17.00] | | Cohen's d | 3.17 |

해석: 실험군(M = 87.75, SD = 4.56)의 점수가 대조군(M = 74.33, SD = 3.87)보다 통계적으로 유의하게 높았습니다, t(22) = 7.77, p < .001. 평균 차이는 13.42점(95% CI [9.84, 17.00])이었으며, Cohen's d = 3.17로 매우 큰 효과 크기를 나타냈습니다.

효과 크기 기준 (Cohen's d)

| Cohen's d | 해석 | |-----------|----------| | 0.20 | 작은 효과 | | 0.50 | 중간 효과 | | 0.80 | 큰 효과 |

우리의 d = 3.17은 "큰 효과"를 훨씬 초과하는 매우 강한 효과입니다.

제2부: 대응표본 t검정

연구 시나리오

영양사가 8주간의 다이어트 프로그램 전후 참가자 15명의 체중 변화를 측정합니다.

예제 데이터

| 참가자 | 프로그램 전 (kg) | 프로그램 후 (kg) | 차이 (후-전) | |--------|-----------------|-----------------|-------------| | 1 | 82.5 | 78.3 | -4.2 | | 2 | 75.0 | 71.8 | -3.2 | | 3 | 90.2 | 86.1 | -4.1 | | 4 | 68.7 | 66.5 | -2.2 | | 5 | 85.3 | 80.7 | -4.6 | | 6 | 79.1 | 75.9 | -3.2 | | 7 | 93.6 | 89.4 | -4.2 | | 8 | 71.4 | 69.1 | -2.3 | | 9 | 88.0 | 83.5 | -4.5 | | 10 | 76.8 | 73.6 | -3.2 | | 11 | 84.2 | 80.8 | -3.4 | | 12 | 91.5 | 87.2 | -4.3 | | 13 | 73.3 | 71.0 | -2.3 | | 14 | 87.6 | 83.1 | -4.5 | | 15 | 80.0 | 76.4 | -3.6 |

기술통계

| 측정 | 값 | |---------------|----------| | 차이의 평균 | -3.59 kg | | 차이의 표준편차 | 0.83 kg | | 차이의 중앙값 | -3.40 kg | | 최소 차이 | -4.60 kg | | 최대 차이 | -2.20 kg | | n (쌍) | 15 |

모든 참가자가 체중이 감소했습니다(모든 차이가 음수).

1단계: 가정 확인

차이값의 정규성 검정

| 검정 | 통계량 | p-값 | |---------------|--------|-------| | Shapiro-Wilk | 0.942 | 0.412 |

p-값이 0.05보다 크므로 차이값의 정규성이 충족됩니다.

이상치 확인

| 통계량 | 값 | |------------|--------| | Q1 | -4.30 | | Q3 | -3.00 | | IQR | 1.30 | | 하한 울타리 | -6.25 | | 상한 울타리 | -1.05 |

모든 차이값이 울타리 안에 있으므로 이상치가 없습니다.

2단계: 가설 설정

  • 귀무가설(H0): 프로그램 전후 체중 차이의 평균은 0이다 (mu_d = 0).
  • 대립가설(H1): 프로그램 전후 체중 차이의 평균은 0이 아니다 (mu_d != 0).

3단계: t 통계량 계산

t = 차이의 평균 / (차이의 표준편차 / sqrt(n))

t = -3.59 / (0.83 / sqrt(15))

t = -3.59 / (0.83 / 3.873)

t = -3.59 / 0.2143

t = -16.75

자유도: df = n - 1 = 14

4단계: 결과 해석

| 통계량 | 값 | |---------------------|---------------| | t | -16.75 | | 자유도 (df) | 14 | | p-값 (양측) | < 0.001 | | 평균 차이 | -3.59 kg | | 95% 신뢰구간 | [-4.05, -3.13] | | Cohen's d (paired) | 4.33 |

해석: 대응표본 t검정 결과, 다이어트 프로그램 후 체중(M = 78.23, SD = 6.85)이 프로그램 전(M = 81.81, SD = 7.47)보다 통계적으로 유의하게 감소했습니다, t(14) = -16.75, p < .001. 평균 체중 감소는 3.59 kg(95% CI [3.13, 4.05])이었으며, Cohen's d = 4.33으로 매우 큰 효과를 보였습니다.

결과 보고 방법

독립표본 t검정 보고 예시

새로운 교수법의 효과를 평가하기 위해 독립표본 t검정을 실시하였다. 실험군(M = 87.75, SD = 4.56)의 시험 점수가 대조군(M = 74.33, SD = 3.87)보다 통계적으로 유의하게 높았다, t(22) = 7.77, p < .001, d = 3.17. 이는 새로운 교수법이 학생들의 학업 성취도 향상에 효과적임을 시사한다.

대응표본 t검정 보고 예시

8주간 다이어트 프로그램의 효과를 검증하기 위해 대응표본 t검정을 실시하였다. 프로그램 참여 후 체중(M = 78.23, SD = 6.85)이 참여 전(M = 81.81, SD = 7.47)에 비해 통계적으로 유의하게 감소하였다, t(14) = -16.75, p < .001. 평균 체중 감소량은 3.59 kg(95% CI [3.13, 4.05])이었으며, 효과 크기는 매우 컸다(d = 4.33).

t검정 선택 의사결정 흐름도

다음 질문에 순서대로 답하세요:

1. 비교하려는 집단이 몇 개인가요?

  • 3개 이상: ANOVA를 사용하세요.
  • 2개: 계속 진행하세요.

2. 두 집단이 독립적인가요, 대응(짝)인가요?

  • 독립적 (서로 다른 사람들): 독립표본 t검정 방향으로.
  • 대응 (같은 사람, 전후 측정): 대응표본 t검정 방향으로.

3. 정규성 가정이 충족되나요?

  • 예: t검정을 사용합니다.
  • 아니요 (그리고 n < 30):
    • 독립표본인 경우: Mann-Whitney U 검정
    • 대응표본인 경우: Wilcoxon 부호순위 검정

4. (독립표본인 경우) 등분산 가정이 충족되나요?

  • 예: Student의 t검정 사용.
  • 아니요: Welch의 t검정 사용.

주의해야 할 실수들

  1. 독립표본과 대응표본을 혼동하는 경우. 같은 사람을 두 번 측정했으면 대응표본입니다. 독립표본 t검정을 잘못 사용하면 검정력이 낮아집니다.

  2. 정규성 검정을 생략하는 경우. 표본 크기가 작을 때(n < 30) 정규성 가정을 무시하면 부정확한 p-값이 나올 수 있습니다.

  3. 다중 비교 보정을 하지 않는 경우. 여러 번의 t검정을 수행하면 제1종 오류(거짓 양성)가 증가합니다. 3개 이상의 집단을 비교할 때는 ANOVA를 사용하세요.

  4. 효과 크기를 무시하는 경우. 표본이 크면 사소한 차이도 통계적으로 유의할 수 있습니다. 항상 Cohen's d 같은 효과 크기를 보고하세요.

  5. 단측 검정을 남용하는 경우. 단측 검정은 데이터를 보기 전에 방향에 대한 강한 이론적 근거가 있을 때만 사용해야 합니다. 사후적으로 단측 검정으로 전환하는 것은 부적절합니다.

StatMate로 직접 분석해보기

직접 데이터를 분석해 보세요:

자주 묻는 질문 (FAQ)

t검정에 필요한 최소 표본 크기는 얼마인가요?

엄격한 최소값은 없지만, 각 집단에 최소 10-15명을 권장합니다. 중간 크기의 효과(d = 0.5)를 80% 검정력으로 감지하려면 각 집단에 약 64명이 필요합니다(독립표본). 대응표본은 개인차를 통제하므로 더 적은 수로도 충분할 수 있습니다. 사전 검정력 분석(power analysis)을 수행하여 연구에 필요한 정확한 표본 크기를 계산하는 것이 좋습니다.

Welch의 t검정과 Student의 t검정 중 어떤 것을 사용해야 하나요?

Welch의 t검정은 등분산을 가정하지 않으므로 더 안전한 선택입니다. 등분산이 충족될 때에도 Welch 검정은 Student 검정과 거의 동일한 결과를 줍니다. 많은 통계학자들은 Levene의 검정 결과에 관계없이 항상 Welch 검정을 사용할 것을 권장합니다. 특히 두 집단의 크기가 다를 때는 Welch 검정이 필수적입니다.

p-값이 0.05보다 크면 차이가 없다고 결론 내릴 수 있나요?

아닙니다. p > 0.05는 "차이가 없다"는 증거가 아니라, "차이가 있다는 충분한 증거를 찾지 못했다"는 의미입니다. 표본 크기가 작아서 실제 차이를 감지하지 못했을 수 있습니다(제2종 오류). 결론을 내리기 전에 효과 크기와 신뢰구간을 함께 확인하세요. 동등성을 입증하려면 TOST(Two One-Sided Tests) 절차를 사용합니다.

대응표본 t검정에서 정규성은 무엇에 대해 검정하나요?

**차이값(difference scores)**의 정규성을 검정합니다. 각 참가자의 (사후 - 사전) 값을 계산한 후, 이 차이값들이 정규분포를 따르는지 확인합니다. 원시 점수(사전, 사후 각각)가 정규분포를 따르지 않더라도, 차이값이 정규분포이면 대응표본 t검정을 사용할 수 있습니다.

t검정 대신 비모수 검정을 사용하면 어떤 단점이 있나요?

비모수 검정(Mann-Whitney U, Wilcoxon 부호순위)은 정규성을 가정하지 않아 유연하지만, 정규 분포 데이터에서는 t검정보다 검정력이 약 5% 낮습니다. 즉, 실제 차이가 있어도 감지하지 못할 확률이 약간 높아집니다. 데이터가 정규 분포에 가까우면 t검정이 더 효율적이고, 정규성 위반이 심하면 비모수 검정이 더 신뢰할 수 있습니다.

양측 검정과 단측 검정의 차이는 무엇인가요?

양측 검정은 "차이가 있는가?"(방향 무관)를 검정하고, 단측 검정은 "A가 B보다 큰가?" 또는 "A가 B보다 작은가?"처럼 특정 방향의 차이만 검정합니다. 단측 검정은 양측 검정보다 검정력이 높지만, 데이터 수집 전에 방향에 대한 강한 이론적 근거가 있어야 합니다. 확신이 없으면 양측 검정을 사용하세요.

같은 데이터에서 여러 번 t검정을 하면 왜 문제가 되나요?

각 t검정에서 제1종 오류율은 5%이지만, 여러 검정을 수행하면 **전체 오류율(family-wise error rate)**이 급격히 증가합니다. 예를 들어, 10번의 독립적인 t검정을 수행하면 적어도 하나의 거짓 양성이 나올 확률은 약 40%입니다. 3개 이상의 집단을 비교할 때는 ANOVA를 사용하고, 사후 비교에는 Bonferroni나 Tukey HSD 같은 다중 비교 보정을 적용하세요.

지금 바로 계산해 보세요

StatMate의 무료 통계 계산기로 데이터를 분석하고 APA 형식 결과를 받아보세요.

계산기 시작하기

통계 분석 팁 받아보기

매주 통계 분석 팁, APA 형식 가이드, 새 계산기 업데이트를 받아보세요.

스팸 없음. 언제든 구독 취소 가능.