What is the difference between chi-square test of independence and goodness-of-fit?

The test of independence examines whether two categorical variables are related using a contingency table. The goodness-of-fit test examines whether a single variable's observed distribution matches an expected distribution. Both use the chi-square statistic but have different purposes.

What should I do if expected frequencies are below 5?

If more than 20% of cells have expected frequencies below 5, the chi-square approximation is unreliable. Use Fisher's exact test for 2x2 tables, or combine categories to increase expected frequencies for larger tables.

Can I use chi-square with ordinal variables?

Yes, but chi-square treats all categories as nominal and ignores the ordering. For ordinal data, consider the Cochran-Armitage trend test or Spearman correlation, which account for the natural ordering of categories.

How do I interpret Cramér's V?

Cramér's V ranges from 0 to 1, where 0 means no association and 1 means perfect association. For a 2x2 table: .10 is small, .30 is medium, .50 is large. For larger tables, the benchmarks decrease as the table dimensions increase.

What is the minimum sample size for a chi-square test?

There is no absolute minimum, but all expected cell frequencies should be at least 1, and no more than 20% should be below 5. In practice, this typically requires at least 20-30 total observations for a 2x2 table.

Can chi-square test more than two variables at once?

The standard chi-square test examines the association between exactly two variables. For three or more variables, use log-linear analysis or stratified chi-square tests (Cochran-Mantel-Haenszel test).

Should I report observed and expected frequencies?

Reporting observed frequencies is essential. Expected frequencies help readers evaluate which cells deviate most from independence. Include them in a table for larger contingency tables, or mention key deviations in the text.

What is the difference between chi-square and Fisher's exact test?

Chi-square uses a large-sample approximation, while Fisher's exact test calculates exact probabilities. Fisher's is preferred for small samples (expected frequencies below 5) and 2x2 tables. For larger tables with adequate sample size, chi-square is standard.

카이제곱 검정 APA 보고법: 독립성 검정 & Cramér's V 효과크기 (APA 7판 복사용)

카이제곱 APA 보고의 기본

카이제곱 검정은 사회과학에서 가장 자주 사용되는 통계 검정 중 하나이지만, 많은 연구자가 올바른 APA 포맷팅에 어려움을 겪습니다. 독립성 검정이든 적합도 검정이든, 이 가이드에서 필요한 정확한 형식을 다룹니다.

카이제곱 독립성 검정

독립성 검정은 두 범주형 변수가 관련이 있는지 검토합니다. APA 형식에는 카이제곱 값, 자유도, 표본 크기, p값, 효과크기 측정값이 포함됩니다.

APA 템플릿: chi-square(df, N = 표본크기) = X.XX, p = .XXX, V = X.XX

예시: 성별과 직업 선택 간의 관계를 검토하기 위해 카이제곱 독립성 검정을 실시했다. 두 변수 간의 관계가 유의했다, chi-square(2, N = 180) = 9.87, p = .007, V = .23.

핵심 구성요소

카이제곱 통계량: 괄호 안에 자유도
N (총 표본 크기): 괄호 안에 포함
정확한 p값 (또는 매우 작은 값의 경우 "p < .001")
효과크기: 큰 표에는 Cramer's V, 2x2 표에는 phi

적합도 검정

적합도 검정은 관측 빈도가 단일 범주형 변수의 기대 빈도와 일치하는지 확인합니다.

예시: 카이제곱 적합도 검정 결과, 세 가지 메뉴 옵션에 대한 선호도가 균등하게 분포되지 않았다, chi-square(2, N = 120) = 14.30, p < .001.

Fisher 정확 검정

기대 셀 빈도가 5 미만일 때는 카이제곱 대신 Fisher 정확 검정을 보고합니다. 이는 소표본에서 흔히 발생합니다.

예시: Fisher 정확 검정 결과, 치료 유형과 회복 상태 간에 유의한 연관이 있었다, p = .023, OR = 3.50, 95% CI [1.15, 10.67].

교차표 보고

관측 빈도(선택적으로 기대 빈도)를 보여주는 분할표를 항상 포함하세요. APA는 해석을 돕기 위해 원래 빈도와 함께 백분율을 제시할 것을 권장합니다.

흔한 보고 실수

N을 빠뜨리는 것. 카이제곱 보고 형식에 항상 총 표본 크기를 포함하세요.
기대 빈도가 작을 때 카이제곱 사용. 기대 빈도가 5 미만인 셀이 있으면 Fisher 정확 검정을 사용하세요.
효과크기 누락. 많은 학술지에서 카이제곱 결과와 함께 Cramer's V 또는 phi를 요구합니다.
유의성만 보고. 검정이 유의한지만이 아니라, 결과의 패턴을 설명하세요.

카이제곱 적합도 검정: APA 보고법

독립성 검정이 두 범주형 변수 간의 관계를 검토하는 반면, 적합도 검정은 다른 목적을 가집니다. 하나의 범주형 변수에 대한 관측 빈도 분포가 이론적으로 기대되는 분포와 일치하는지를 검토합니다.

적합도 검정을 사용해야 하는 경우

관측 빈도가 하나의 변수에 대한 기대 빈도와 다른지 확인하고자 할 때 적합도 검정을 사용합니다. 대표적인 상황은 다음과 같습니다:

응답이 범주들에 걸쳐 균등하게 분포되어 있는지 검정
관측 비율을 모집단 규준이나 이론적 값과 비교
주사위, 동전, 무작위 과정이 균일한 결과를 산출하는지 평가
표본의 인구통계학적 비율이 알려진 모집단 분포와 일치하는지 확인

자유도

적합도 검정의 자유도는 독립성 검정과 다르게 계산됩니다:

적합도 검정: df = 범주의 수 - 1

독립성 검정: df = (행의 수 - 1) x (열의 수 - 1)

예를 들어, 4개 선택지에 대한 선호도가 균등하게 분포되어 있는지 검정하는 경우, df = 4 - 1 = 3입니다.

APA 보고 예시

균등 기대빈도의 경우:

학생들이 4개의 선택 교양 과목 중 선호도를 보이는지 확인하기 위해 카이제곱 적합도 검정을 실시했다. 결과는 균등 분포로부터 유의한 이탈을 나타냈다, chi-square(3, N = 200) = 8.92, p = .030. 심리학(n = 68, 34.0%)이 다른 세 과목보다 선호되었으며, 나머지 과목은 각각 약 22%의 등록률을 보였다.

비균등 기대빈도의 경우:

표본의 민족 구성이 대학 전체 모집단과 일치하는지 확인하기 위해 카이제곱 적합도 검정을 실시했다. 기대 비율은 학교 등록 데이터에 기반했다(백인 45%, 히스패닉 25%, 흑인 18%, 아시아계 12%). 관측 분포는 기대 비율과 유의하게 다르지 않았다, chi-square(3, N = 350) = 4.21, p = .240.

기대 분포 보고

독자가 영가설을 이해할 수 있도록 보고서에 항상 기대 분포를 명시하세요. 균등 비율을 검정하는 경우 이를 명확히 기술하고, 모집단 규준이나 선행연구를 사용하는 경우 기대값의 출처를 인용하세요.

APA 표 형식으로 카이제곱 결과 보고하기

분할표가 2x2보다 큰 경우, 잘 정리된 표로 결과를 제시하는 것이 명확성과 해석 가능성을 위해 필수적입니다.

표를 사용해야 하는 경우

다음과 같은 경우 교차분석표를 포함하세요:

분할표가 3개 이상의 행 또는 열을 가진 경우
여러 범주에 걸쳐 결과 패턴을 보여줘야 하는 경우
관측 빈도와 기대 빈도가 셀 간에 상당히 다른 경우
행 또는 열 백분율이 해석에 중요한 경우

APA 교차분석표 형식

APA 표는 관측 빈도, 기대 빈도(괄호 또는 대괄호 안), 행 또는 열 백분율을 포함해야 합니다. 다음은 모범 레이아웃입니다:

표 1

교수 방법과 학생 성취 수준의 교차분석

| | 평균 이하 | 평균 | 평균 이상 | 합계 | |---|---|---|---|---| | 전통 교수법 | 25 [18.3] (41.7%) | 20 [22.0] (33.3%) | 15 [19.7] (25.0%) | 60 | | 능동 학습 | 12 [15.9] (20.3%) | 20 [19.1] (33.9%) | 27 [17.1] (45.8%) | 59 | | 온라인 | 8 [10.8] (20.0%) | 15 [13.0] (37.5%) | 17 [11.2] (42.5%) | 40 | | 합계 | 45 | 55 | 59 | 159 |

주. 대괄호 안의 숫자는 기대빈도임. 괄호 안의 숫자는 행 백분율임.

표 작성 지침

표에 번호를 매기세요 (표 1, 표 2 등)
표 제목은 이탤릭체로 작성하세요
주석을 포함하여 대괄호, 괄호, 약어를 설명하세요
행과 열 모두에 합계를 제시하세요
종속변수에 대해 집단을 비교할 때는 행 백분율을, 독립변수가 행에 있을 때는 열 백분율을 사용하세요
가장 큰 잔차를 가진 셀을 굵게 표시하거나 강조하여 가장 중요한 편차에 주목하게 하세요

어떤 백분율을 보고할 것인가

행 백분율과 열 백분율의 선택은 연구 질문에 따라 달라집니다:

행 백분율: 각 집단이 결과 범주에 걸쳐 어떻게 분포하는지를 보여줍니다. 행 변수가 독립변수일 때 사용하세요.
열 백분율: 각 결과 범주의 구성을 보여줍니다. 열 변수가 독립변수일 때 사용하세요.

사용한 백분율의 유형을 표 주석이나 본문 설명에 항상 보고하세요.

가정 검토와 카이제곱 검정이 실패하는 경우

카이제곱 검정은 여러 가정에 의존합니다. 이러한 가정을 위반하면 오해의 소지가 있는 결과를 산출할 수 있습니다.

기대빈도 요건

가장 중요한 가정은 카이제곱 근사가 유효하기 위해 기대 셀 빈도가 충분히 커야 한다는 것입니다. 표준 규칙은 다음과 같습니다:

셀의 20% 이상이 기대빈도 5 미만이어서는 안 됨
어떤 셀도 기대빈도 1 미만이어서는 안 됨

이 조건이 충족되지 않으면, 카이제곱 통계량이 카이제곱 분포를 따르지 않아 부정확한 p값이 산출될 수 있습니다.

가정이 위반될 때의 대처 방법

기대빈도가 너무 작을 때 몇 가지 선택지가 있습니다:

Fisher 정확 검정 (2x2 표): 카이제곱 근사에 의존하지 않고 정확한 확률을 계산합니다. 소표본에 대한 가장 선호되는 대안입니다.
범주 통합: 인접하거나 이론적으로 유사한 범주를 합쳐 기대빈도를 증가시킵니다. 예를 들어, "매우 동의"와 "동의"를 하나의 범주로 결합합니다. 단, 이론적으로 타당한 범주만 결합하세요.
추가 데이터 수집: 가능하다면 표본 크기를 늘려 기대빈도를 비례적으로 증가시킵니다.
큰 표에 대한 정확 검정: R이나 SAS를 포함한 일부 통계 소프트웨어는 2x2보다 큰 표에 대한 정확 검정을 계산할 수 있지만, 계산량이 많을 수 있습니다.

관측의 독립성

각 관측치는 분할표의 하나의 셀에만 기여해야 합니다. 이는 다음을 의미합니다:

반복 측정 불가: 각 참가자는 한 번만 나타나야 합니다. 대응(짝) 데이터가 있는 경우 McNemar 검정(2x2) 또는 Cochran의 Q 검정을 사용하세요.
중첩 데이터 불가: 참가자가 집단화되어 있는 경우(예: 교실 내의 학생), 표준 카이제곱은 군집화를 고려하지 않습니다. 다수준 로그선형 모형을 사용하거나 설계 효과를 조정하세요.

표본 크기 고려사항

카이제곱은 엄격한 최소 표본 크기 요건이 없지만, 실용적 지침은 다음과 같습니다:

2x2 표의 경우, 일반적으로 최소 20-30개의 총 관측치가 필요합니다
더 큰 표의 경우, 총 N은 셀 수의 최소 5배 이상이어야 합니다 (예: 3x3 표의 경우 최소 45)
매우 큰 표본은 사소한 연관성도 통계적으로 유의하게 만들 수 있으므로, 항상 p값과 함께 효과크기를 보고하세요

무작위 표집

카이제곱 검정은 데이터가 무작위 표집이나 무작위 배정을 통해 얻어졌다고 가정합니다. 이 가정이 위반된 경우(예: 편의 표본), 결과를 주의하여 해석하고 이 제한점을 명시하세요.

오즈비와 상대위험도: Cramer's V를 넘어서

2x2 분할표에서 Cramer's V(phi 계수와 동일)만이 연관성의 강도를 정량화하는 유일한 방법은 아닙니다. 오즈비와 상대위험도는 특히 임상 및 역학 연구에서 더 해석 가능한 효과크기를 제공합니다.

오즈비 (OR)

오즈비는 한 집단에서 결과가 발생할 오즈를 다른 집단의 동일한 결과 발생 오즈와 비교합니다.

해석 지침:

OR = 1: 변수 간 연관성 없음
OR > 1: 첫 번째 집단에서 결과 발생 가능성이 더 높음
OR < 1: 첫 번째 집단에서 결과 발생 가능성이 더 낮음

APA 보고 예시:

카이제곱 독립성 검정 결과, 흡연 상태와 폐질환 간에 유의한 연관이 있었다, chi-square(1, N = 500) = 18.74, p < .001, phi = .19. 흡연자는 비흡연자에 비해 폐질환 발생 오즈가 유의하게 높았다, OR = 2.45, 95% CI [1.23, 4.87].

OR과 Cramer's V의 사용 시기 비교

| 측정치 | 적합한 상황 | 범위 | APA 요구사항 | |---|---|---|---| | Phi (phi) | 2x2 표, 일반적 연관성 | 0~1 | 표준 효과크기 | | Cramer's V | 2x2보다 큰 표 | 0~1 | 표준 효과크기 | | 오즈비 | 2x2 표, 임상/역학 연구 | 0~무한대 | 95% CI와 함께 보고 | | 상대위험도 | 2x2 표, 코호트/실험 연구 | 0~무한대 | 95% CI와 함께 보고 |

상대위험도 (RR)

상대위험도(위험비라고도 함)는 한 집단 대 다른 집단에서 결과가 발생할 확률을 비교합니다. 오즈비와 달리 상대위험도는 확률의 비율로 직접 해석할 수 있습니다.

APA 보고 예시:

중재 집단의 참가자는 통제 집단에 비해 재발 위험이 유의하게 낮았다, RR = 0.55, 95% CI [0.38, 0.79], p = .001. 이는 재발 확률이 45% 감소했음을 나타낸다.

중요한 구분

오즈비는 모든 연구 설계(횡단 연구, 환자-대조군 연구, 코호트 연구)에서 계산 가능
상대위험도는 코호트 연구나 무작위 대조 시험에서만 계산해야 하며, 환자-대조군 설계에서는 사용하지 않음

결과가 드문 경우(유병률 10% 미만), 오즈비는 상대위험도에 근사합니다. 결과가 흔한 경우, 오즈비는 상대위험도에 비해 효과를 과대평가하는 경향이 있습니다.

여러 효과크기 측정치 함께 보고하기

일부 분석에서는 카이제곱 기반 효과크기(phi 또는 Cramer's V)와 오즈비를 함께 보고하는 것이 적절합니다. 카이제곱 효과크기는 연관성의 전반적 강도를 요약하고, 오즈비는 임상적으로 더 해석 가능한 효과 측정치를 제공합니다.

자주 묻는 질문

카이제곱 독립성 검정과 적합도 검정의 차이점은 무엇인가요?

독립성 검정은 행과 열이 서로 다른 변수를 나타내는 분할표를 사용하여 두 범주형 변수가 관련되어 있는지 검토합니다. 적합도 검정은 단일 변수의 관측 분포가 이론적으로 기대되는 분포와 일치하는지 검토합니다. 둘 다 카이제곱 통계량을 사용하지만 목적이 다릅니다: 독립성 검정은 변수 간 관계를 분석하고, 적합도 검정은 관측 데이터를 기대 패턴과 비교합니다.

기대빈도가 5 미만인 경우 어떻게 해야 하나요?

셀의 20% 이상에서 기대빈도가 5 미만이면 카이제곱 근사가 신뢰할 수 없게 됩니다. 2x2 표의 경우, 정확한 확률을 계산하는 Fisher 정확 검정을 사용하세요. 더 큰 표의 경우, 이론적으로 유사한 범주를 결합하여 셀 빈도를 높이거나 R 또는 SAS와 같은 소프트웨어에서 사용 가능한 정확 검정을 사용하세요. 이 가정을 단순히 무시해서는 안 됩니다.

순서형 변수에 카이제곱을 사용할 수 있나요?

네, 하지만 표준 카이제곱 검정은 모든 범주를 명목형으로 취급하고 자연스러운 순서를 무시합니다. 이는 데이터의 추세나 선형 패턴을 놓칠 수 있습니다. 순서형 데이터의 경우, Cochran-Armitage 추세 검정(순서가 있는 열이 포함된 2xk 표)이나 순서 범주 간 단조 관계를 탐지할 수 있는 Spearman 순위 상관을 고려하세요.

Cramer's V를 어떻게 해석하나요?

Cramer's V는 0(연관 없음)에서 1(완전한 연관)까지의 범위를 가집니다. 해석 기준은 표의 작은 차원(df*)에 따라 달라집니다. 2x2 표(df* = 1)의 경우: .10은 약한, .30은 중간, .50은 강한 효과입니다. 3x3 이상의 표에서는 기준이 낮아집니다. 예를 들어 df* = 2인 경우: .07은 약한, .21은 중간, .35는 강한 효과입니다. Cramer's V를 평가할 때 항상 표의 차원을 고려하세요.

카이제곱 검정에 필요한 최소 표본 크기는 얼마인가요?

절대적인 최소 표본 크기는 없지만, 기대빈도 규칙이 실용적 지침을 제공합니다: 모든 기대 셀 빈도는 최소 1 이상이어야 하고, 20% 이상이 5 미만이어서는 안 됩니다. 2x2 표의 경우 일반적으로 최소 20-30개의 총 관측치가 필요합니다. 더 큰 표에서는 총 표본 크기가 셀 수의 최소 5배 이상을 목표로 하세요 (예: 3x3 표의 경우 45).

카이제곱으로 두 개 이상의 변수를 동시에 검정할 수 있나요?

표준 카이제곱 검정은 정확히 두 개의 범주형 변수 간의 연관성을 검토합니다. 세 개 이상의 변수에 대해서는 다른 접근법이 필요합니다: 로그선형 분석은 여러 범주형 변수 간의 관계를 동시에 모형화하고, Cochran-Mantel-Haenszel(CMH) 검정은 세 번째 층화 변수를 통제하면서 두 변수 간 연관성을 검토합니다.

관측빈도와 기대빈도를 모두 보고해야 하나요?

관측빈도 보고는 모든 카이제곱 분석에서 필수적입니다. 기대빈도는 독자가 영가설 하에서 기대되는 것과 어떤 셀이 가장 많이 이탈하는지를 평가하는 데 도움을 줍니다. 2x2 표의 경우 본문에 기대값을 포함할 수 있습니다. 더 큰 분할표(3x3 이상)의 경우, 관측 빈도, 대괄호 안의 기대 빈도, 백분율을 포함한 정리된 표로 제시하세요.

카이제곱 검정과 Fisher 정확 검정의 차이점은 무엇인가요?

카이제곱 검정은 p값을 계산하기 위해 대표본 근사를 사용하는 반면, Fisher 정확 검정은 영가설 하에서 데이터(또는 더 극단적인 데이터)를 관찰할 정확한 확률을 계산합니다. Fisher 정확 검정은 기대 셀 빈도가 5 미만이거나 총 표본 크기가 작을 때 선호됩니다. 적절한 표본 크기와 기대빈도를 가진 더 큰 표에서는 카이제곱 검정이 표준이며 계산적으로 더 간단합니다.

직접 해보기

StatMate의 무료 카이제곱 계산기 또는 Fisher 정확 검정 계산기를 사용하여 출판 준비된 APA 결과를 즉시 얻으세요. 효과크기, 기대 빈도, 원클릭 Word 내보내기를 모두 포함합니다.