What is the difference between Pearson and Spearman correlation?

Pearson's r measures the strength of a linear relationship between two continuous, normally distributed variables. Spearman's rs measures the monotonic relationship using ranks and is appropriate for ordinal data or when normality is violated.

Can a correlation be exactly 0?

In theory, r = 0 means no linear relationship. In practice, sample correlations are rarely exactly zero. A very small, non-significant r (e.g., .03) is interpreted as no meaningful relationship.

How do I report a non-significant correlation?

Use the same format as significant results. Example: There was no statistically significant correlation between X and Y, r(48) = .12, p = .410. Always include the effect size regardless of significance.

What sample size do I need for correlation analysis?

To detect a medium correlation (r = .30) with 80% power at alpha = .05, you need approximately 85 participants. For small correlations (r = .10), you need about 782 participants.

Can I correlate categorical variables?

Pearson and Spearman correlations require at least ordinal data. For two categorical variables, use Cramér's V or phi coefficient from a chi-square test. For one categorical and one continuous variable, use point-biserial correlation.

What does r² tell me that r does not?

r² (coefficient of determination) represents the proportion of shared variance between two variables. While r = .50 sounds moderate, r² = .25 reveals that only 25% of variance is shared, providing a more intuitive measure of practical significance.

Should I use one-tailed or two-tailed tests for correlation?

Use two-tailed tests unless you have a strong theoretical reason to predict the direction of the relationship before collecting data. Most journals expect two-tailed tests as the default.

How do I handle outliers in correlation analysis?

First, examine scatter plots to identify outliers. Report the correlation both with and without outliers if removal substantially changes r. Consider using Spearman's correlation, which is less sensitive to outliers than Pearson's r.

상관분석 결과를 APA 형식으로 보고하는 방법: Pearson r, Spearman ρ & 상관표

APA에서 상관분석 보고의 기본

상관분석은 사회과학 및 행동과학에서 가장 널리 사용되는 통계 기법 중 하나입니다. 학습 시간과 시험 점수의 관계를 조사하든, 스트레스와 수면의 질의 관련성을 탐구하든, 연구 결과를 표준화된 형식으로 보고해야 합니다.

APA 7판은 상관 보고에 상관계수, 자유도(또는 표본 크기), p값을 포함하도록 요구합니다. 상관의 유형에 따라 결정계수(r²)와 신뢰구간도 보고할 수 있습니다. 이러한 세부사항을 정확히 작성하는 것은 출판 가능한 원고에 필수적입니다.

이 가이드에서는 Pearson r, Spearman r_s, 점이연 상관 r_pb, 상관행렬, 그리고 연구자들이 가장 흔히 저지르는 형식 실수를 다룹니다.

Pearson 상관 보고

Pearson 적률상관계수는 두 연속변수 간 선형 관계의 강도와 방향을 측정합니다. 두 변수가 모두 등간 또는 비율 척도로 측정되고 관계가 대략적으로 선형일 때 기본 상관 방법입니다.

APA 템플릿

Pearson 상관을 보고하는 표준 APA 형식은 다음과 같습니다:

r(df) = .XX, p = .XXX

여기서 df(자유도)는 N - 2입니다. 예를 들어, 참가자가 50명이면 df = 48입니다.

주요 형식 규칙

앞의 0 생략. r은 -1과 +1 사이에 제한되므로 1.0을 초과할 수 없습니다. 따라서 APA 양식은 앞의 0을 생략합니다: r = 0.42가 아니라 r = .42로 씁니다. p 값에도 동일한 규칙이 적용됩니다.
r은 소수점 이하 두 자리. 상관계수를 소수점 이하 두 자리로 보고합니다(예: .42, .4나 .4200이 아님).
정확한 p 값. 정확한 p 값을 소수점 이하 세 자리로 보고합니다(예: p = .003). 값이 .001 미만일 때만 p < .001을 사용합니다.
괄호 안에 자유도. 항상 r 바로 뒤에 df = N - 2를 포함합니다.

전체 보고 예시

주당 학습 시간과 기말시험 점수 간의 관계를 평가하기 위해 Pearson 상관을 산출하였다. 두 변수 간에 통계적으로 유의한 정적 상관이 있었다, r(48) = .42, p = .003. 학습 시간이 더 많다고 보고한 학생들이 더 높은 시험 점수를 달성하는 경향이 있었다. 결정계수(r² = .18)는 학습 시간이 시험 점수 분산의 약 18%를 설명함을 나타냈다.

구조를 주목하십시오: 분석 목적을 진술하고, 통계적 결과를 보고하고, 관계의 방향을 일상적 언어로 기술하며, 선택적으로 결정계수를 제공하여 추가 맥락을 제공합니다.

r²를 포함해야 할 때

결정계수(r²)는 한 변수의 분산 중 다른 변수로 설명되는 비율을 독자에게 알려줍니다. r²를 포함하는 것이 APA에서 엄격히 요구되는 것은 아니지만, 추상적인 상관계수를 직관적인 백분율로 변환하기 때문에 많은 학술지에서 기대합니다. r = .42는 실질적 유의성을 즉시 전달하지 못할 수 있지만, 분산의 18%가 공유된다고 진술하면 발견이 더 구체적이 됩니다.

상관 강도 해석

Cohen(1988)은 상관계수의 크기를 해석하기 위한 널리 사용되는 기준을 제안하였습니다. 이 지침은 부호에 관계없이 r의 절대값에 적용됩니다.

| r의 절대값 | 해석 | |-------------|------| | .10 - .29 | 작음 | | .30 - .49 | 중간 | | .50 이상 | 큼 |

r = -.55의 상관은 큰 부적 상관입니다. 부호는 방향(정적 또는 부적)을 나타내고, 절대값은 강도를 결정합니다.

주의할 점. 이 기준은 관행이지 엄격한 기준점이 아닙니다. Cohen 자신도 더 나은 참조 틀이 없는 상황을 위한 지침이라고 설명하였습니다. 일부 연구 분야에서 r = .20은 의미 있고 실질적으로 유의한 관계를 나타내며, 다른 분야에서 r = .50은 주목할 만하지 않을 수 있습니다. 항상 해당 분야의 선행 연구 맥락에서 상관을 해석하십시오.

예를 들어, 성격심리학에서 성격 특성과 행동 결과 간의 상관은 .30을 넘는 경우가 드뭅니다. 그 맥락에서 r = .25는 주목할 만한 발견입니다. 물리학이나 공학에서는 측정 오차가 최소화되므로 r = .25는 약하고 실질적으로 사소한 관계를 나타낼 수 있습니다.

상관행렬 보고(표 형식)

세 개 이상의 변수 간 상관을 조사할 때는 상관행렬표로 제시하는 것이 표준 관행입니다. APA 형식에는 이러한 표에 대한 구체적인 관행이 있습니다.

APA 상관표 템플릿

Table 1

연구 변수의 평균, 표준편차 및 상호상관

| 변수 | M | SD | 1 | 2 | 3 | 4 | |------|------|------|-------|-------|-------|---| | 1. 학습 시간 | 14.20 | 5.80 | — | | | | | 2. 시험 점수 | 78.50 | 12.30 | .42** | — | | | | 3. 수업 출석 | 0.82 | 0.15 | .38** | .51** | — | | | 4. 수면의 질 | 3.60 | 0.90 | .12 | .08 | .21* | — |

Note. N = 50. M과 SD는 각각 평균과 표준편차를 나타냄.

* p < .05. ** p < .01.

표 형식 규칙

하삼각행렬만 제시. 상관행렬은 대칭이므로 변수 1과 2의 상관은 변수 2와 1의 상관과 같습니다. 양쪽 모두 보고하는 것은 중복입니다. 하삼각행렬(대각선 아래)만 제시하고 대각선에는 대시를 배치합니다.

별표 표기. 유의수준을 나타내기 위해 별표를 사용합니다. 가장 일반적인 관행은 p < .05에 별표 하나, p < .01에 별표 두 개입니다. 일부 연구자는 p < .001에 별표 세 개를 추가합니다. 모든 별표를 표 주석에서 정의합니다.

기술통계 포함. 같은 표에 평균(M)과 표준편차(SD) 열을 추가하면 독자가 상관을 평가하는 데 필요한 모든 것을 한 곳에서 볼 수 있습니다.

변수 번호 매기기. 변수에 번호를 매기고 해당 번호를 열 머리글로 사용합니다. 이렇게 하면 표가 간결하고 읽기 쉽습니다.

행렬 내 앞의 0 생략. 표 내의 모든 r 값은 동일한 앞의 0 생략 규칙을 따릅니다.

Spearman 순위상관 보고

Spearman 순위상관계수(r_s 또는 그리스 문자 rho)는 Pearson r의 비모수적 대안입니다. 두 변수 간 단조 관계의 강도와 방향을 측정합니다.

Spearman을 사용해야 할 때

다음과 같은 경우 Spearman 상관을 사용합니다:

하나 또는 두 변수가 서열 척도로 측정된 경우(예: Likert 평정, 순위).
데이터에 Pearson r을 왜곡할 수 있는 유의한 이상값이 포함된 경우.
관계가 단조적이지만 선형이 아닌 경우(예: 한 변수가 증가하면 다른 변수도 증가하지만, 일정한 비율은 아닌 경우).
정규성 가정이 위반되고 표본 크기가 작은 경우.

APA 템플릿과 예시

형식은 Pearson과 거의 동일하지만, 구별하기 위해 아래첨자 s를 사용합니다:

r_s(df) = .XX, p = .XXX

전체 예시:

고객 만족도 평정과 재구매 가능성 간의 관계를 평가하기 위해 Spearman 순위상관을 산출하였다. 두 변수 간에 강한 정적 상관이 있었다, r_s(78) = .61, p < .001. 만족도 평정이 높을수록 재구매 가능성이 더 컸다.

일부 스타일 가이드에서는 r_s 대신 그리스 문자 rho를 사용합니다. 두 관행 모두 허용되지만, 논문 전체에서 일관성을 유지하십시오.

점이연 상관

점이연 상관(r_pb)은 하나의 변수가 연속형이고 다른 변수가 자연적 이분형(정확히 두 개의 범주를 가진)일 때 사용됩니다. 시험 점수와 합격/불합격 여부의 상관을 구하거나, 급여와 성별의 관계를 조사하는 것이 예시입니다.

APA 템플릿과 예시

r_pb(df) = .XX, p = .XXX

전체 예시:

성별(0 = 여성, 1 = 남성으로 코딩)과 수학 성취도 점수 간의 관계를 조사하기 위해 점이연 상관을 산출하였다. 상관은 통계적으로 유의하였다, r_pb(98) = .31, p = .002. 이는 남학생이 여학생보다 평균적으로 높은 점수를 받았음을 나타낸다.

계산적으로 점이연 상관은 하나의 변수가 이분형일 때 Pearson r과 동일합니다. 구분은 주로 개념적입니다. 심사위원이나 학술지가 r_pb 표시를 요구하지 않는 경우, 표준 Pearson r로 보고하는 것도 허용됩니다.

유의하지 않은 상관

흔한 실수 중 하나는 결과 섹션에서 유의하지 않은 상관을 누락하는 것입니다. APA 지침은 통계적 유의성 도달 여부와 관계없이 모든 계획된 분석을 보고하도록 요구합니다.

유의하지 않은 결과를 보고하는 이유

유의하지 않은 발견은 과학적 기록에 기여합니다. 출판 편향을 방지하고, 향후 메타분석에 정보를 제공하며, 유의한 상관을 해석하는 데 중요한 맥락을 제공합니다.

예시

일일 카페인 섭취량과 학점 간의 상관은 통계적으로 유의하지 않았다, r(48) = .12, p = .394. 이는 이 표본에서 관찰된 수준의 카페인 소비가 학업 성적과 의미 있게 관련되지 않았음을 시사한다.

형식은 유의한 결과와 동일합니다. 발견을 명확히 진술하고, 통계를 보고하며, 간단한 해석을 제공합니다. 유의하지 않은 발견에 대해 사과하거나 무시하지 마십시오.

상관행렬에서 유의하지 않은 상관은 별표 없이 나타납니다. 셀을 비워두거나 유의하지 않은 값을 "ns"로 대체하지 마십시오 — 항상 실제 계수를 보고합니다.

흔한 실수

명확한 설명 없이 r 대신 r² 보고

일부 연구자들은 r을 보고해야 할 때 r²(결정계수)를 주요 통계량으로 보고합니다. 두 가지는 서로 다른 정보를 전달합니다. r = .50은 중간 정도로 들리지만, 대응하는 r² = .25는 분산의 25%만 공유됨을 알려줍니다. r²를 보고할 때는 독자가 r이 아니라 r²임을 알 수 있도록 하고, 두 가지를 모두 보고하는 것을 고려하십시오.

기술에서 상관과 인과 혼동

"학습 시간이 시험 점수를 향상시켰다"라고 말하는 것은 상관으로 확립할 수 없는 인과 관계를 암시합니다. 관련성을 반영하는 언어를 사용하십시오: "~와 관련이 있었다", "~와 연관되었다", "함께 발생하는 경향이 있었다". 인과적 언어는 실험 설계에만 사용합니다.

자유도 미보고

"r = .42, p = .003"이라고 자유도 없이 쓰면 중요한 정보가 빠집니다. 자유도를 통해 독자는 표본 크기(N = df + 2)를 파악하고 분석의 통계적 검정력을 평가할 수 있습니다. 항상 포함하십시오.

r과 p 값에 앞의 0 사용

r은 -1에서 +1, p는 0에서 1로 제한되므로 절대값이 1.0을 초과할 수 없습니다. APA 양식은 앞의 0을 생략하도록 요구합니다: r = 0.42가 아니라 r = .42, p = 0.003이 아니라 p = .003으로 씁니다.

표에서 유의하지 않은 상관 누락

두 변수 간의 상관을 조사했다면 유의성에 관계없이 행렬에 보고합니다. 유의한 상관만 선택적으로 보고하면 결과의 겉보기 패턴을 부풀리게 되며, 이는 보고 편향의 한 형태입니다.

상관 유형 명시 실패

Pearson 대신 Spearman을 사용했거나, 표준 Pearson 대신 점이연 상관을 사용했다면 이를 명시적으로 진술하십시오. Spearman 상관을 계산했는데 단순히 "r = .45"라고만 쓰면 독자가 기본적으로 Pearson으로 가정하므로 오해의 소지가 있습니다.

APA 상관 보고 체크리스트

논문 제출 전에 이 체크리스트를 사용하십시오:

[ ] 상관분석의 목적을 진술했는가
[ ] 상관 유형을 명시했는가(Pearson, Spearman, 점이연)
[ ] 상관계수를 소수점 이하 두 자리로 보고했는가
[ ] 괄호 안에 자유도를 포함했는가(df = N - 2)
[ ] 정확한 p 값을 보고했는가(또는 p < .001)
[ ] r과 p 값에서 앞의 0을 생략했는가
[ ] 관계의 방향과 강도를 문장으로 기술했는가
[ ] 유의하지 않은 상관을 포함하여 모든 계획된 상관을 보고했는가
[ ] 효과크기(r² 또는 Cohen의 기준을 사용한 언어적 해석)를 포함했는가
[ ] 상관행렬을 하삼각행렬과 별표 표기로 형식화했는가
[ ] 유의수준 별표와 표본 크기를 정의하는 표 주석을 추가했는가
[ ] 결과 기술에 인과적 언어가 아닌 관련성 언어를 사용했는가

Spearman 상관을 APA 형식으로 보고하기

Pearson r이 연속적이고 정규분포를 따르는 변수 간의 선형 관계를 측정하는 반면, Spearman 순위상관계수(r_s)는 이러한 가정이 충족되지 않는 상황을 위해 설계되었습니다. 서열 데이터나 비정규 분포를 다루는 연구자에게 Spearman 상관의 보고 시기와 방법을 이해하는 것은 필수적입니다.

Spearman이 적절한 선택인 경우

Spearman 상관은 원시 데이터를 순위로 변환한 후 상관을 계산하므로, 여러 상황에서 강건합니다. 첫째, 변수 중 하나 또는 모두가 서열 척도로 측정된 경우 — 예를 들어 Likert형 문항, 만족도 평정, 또는 학급 순위 — Pearson r은 등간 또는 비율 데이터를 요구하기 때문에 Spearman이 적절합니다. 둘째, 연속형 데이터에 극단적 이상값이 포함된 경우 Spearman의 순위 기반 접근법은 이러한 이탈값에 훨씬 덜 민감합니다. 단일 이상값이 Pearson 상관을 극적으로 증가시키거나 감소시킬 수 있지만 Spearman 계수에는 거의 영향을 미치지 않습니다. 셋째, 두 변수 간의 관계가 단조적이지만 엄밀히 선형은 아닌 경우 Spearman이 관련성을 더 정확하게 포착합니다. 예를 들어, 교육 수준에 따라 소득이 증가하지만 증가율이 일정하지 않은 경우 Spearman이 이 패턴을 더 잘 반영합니다.

Spearman 상관의 APA 형식

보고 템플릿은 Pearson과 동일한 구조이지만, 결정적 차이는 아래첨자 s입니다:

r_s(df) = .XX, p = .XXX

전체 보고 예시:

통증 심각도 평정과 일상 신체활동 수준 간의 관계를 조사하기 위해 Spearman 순위상관을 산출하였다. 통계적으로 유의한 부적 상관이 있었다, r_s(48) = -.38, p = .007. 통증 심각도가 높다고 보고한 참가자들은 낮은 수준의 신체활동에 참여하는 경향이 있었다.

Pearson과 Spearman의 주요 차이

| 특성 | Pearson r | Spearman r_s | |------|-------------|----------------| | 데이터 유형 | 연속형(등간/비율) | 서열형 또는 연속형 | | 관계 유형 | 선형 | 단조적 | | 분포 가정 | 정규(이변량) | 없음 | | 이상값 민감도 | 높음 | 낮음 | | 효과크기 해석 | Cohen 기준 동일 | Cohen 기준 동일 |

확신이 서지 않을 때는 두 계수를 모두 계산할 수 있습니다. Pearson과 Spearman이 실질적으로 다른 값을 산출하면 비선형성이나 이상값의 존재를 시사하며, Spearman 계수가 더 신뢰할 수 있는 측정치일 가능성이 높습니다.

편상관: 혼입변수 통제

편상관은 하나 이상의 추가 변수의 영향을 통계적으로 제거한 후 두 변수 간의 관계를 측정합니다. 이 기법은 혼입변수가 관계의 환상을 만들거나 실제 관계를 가릴 수 있는 관찰 연구에서 매우 중요합니다.

편상관이 중요한 이유

아이스크림 판매량과 익사 사고 간에 강한 정적 상관을 발견했다고 가정해 봅시다. 아이스크림이 익사를 유발한다고 결론짓기 전에, 기온이 두 변수를 모두 증가시킨다는 점을 고려해야 합니다. 기온을 통제하고 아이스크림 판매량과 익사 간의 편상관을 구하면 거의 0에 가까울 것이며, 이는 원래의 상관이 허위적이었음을 드러냅니다.

행동 연구에서 흔한 혼입변수에는 연령, 사회경제적 지위, 교육 수준, 기저 능력 등이 있습니다. 이러한 변수를 통제하지 않으면 오해를 불러일으키는 결론에 도달할 수 있습니다.

편상관의 APA 형식

형식에는 상관 유형, 자유도(이제 N - 2 - k, 여기서 k는 통제된 변수의 수), 계수, p 값, 그리고 어떤 변수가 통제되었는지에 대한 명확한 진술이 포함됩니다:

r(47) = .35, p = .014, 연령을 통제

자유도는 통제된 변수마다 1씩 감소합니다. 참가자 50명에 통제 변수 1개인 경우: df = 50 - 2 - 1 = 47.

전체 보고 예시:

연령을 통제한 후 주당 운동 시간과 우울 점수 간의 관계를 평가하기 위해 편상관을 산출하였다. 운동과 우울 간에 통계적으로 유의한 부적 편상관이 있었다, r(47) = -.35, p = .014. 운동 빈도가 높을수록 참가자의 연령과 독립적으로 우울 점수가 낮은 것과 관련되었다. 운동과 우울 간의 영차 상관은 r(48) = -.41, p = .003이었으며, 이는 연령이 원래 관계의 적은 부분을 설명했음을 시사한다.

편상관과 영차 상관 중 어느 것을 보고할지

영차 상관은 통제 없이 계산한 원시 이변량 상관입니다. 혼입변수가 이론적으로 관련이 있을 때는 영차 상관과 편상관을 모두 보고하십시오. 두 값을 비교하면 독자에게 혼입변수를 통제한 후 관계가 얼마나 변하는지를 알려줍니다:

편상관이 영차 상관보다 실질적으로 작으면, 통제 변수가 의미 있는 혼입변수였습니다.
편상관이 영차 상관과 유사하면, 통제 변수가 관계에 거의 영향을 미치지 않았습니다.
편상관이 영차 상관보다 큰 경우(억압 효과), 통제 변수가 진정한 관계의 일부를 가리고 있었습니다.

APA 표 형식의 상관행렬

연구에 여러 변수가 포함된 경우, 모든 쌍별 상관을 상관행렬로 제시하는 것이 본문에서 각각을 개별적으로 기술하는 것보다 훨씬 효율적입니다. APA 형식에는 이러한 표를 구성하기 위한 잘 정립된 관행이 있습니다.

상관행렬을 사용해야 할 때

세 개 이상의 변수가 있고 모든 쌍별 관계를 보여주고 싶을 때 상관행렬표를 사용합니다. 이는 척도, 설문지, 또는 여러 측정 구인이 있는 데이터셋을 다루는 연구에서 표준적입니다. 변수가 두 개뿐이라면 본문에서 상관을 보고하는 것이 좋습니다.

완전한 APA 상관행렬 예시

Table 1

주요 연구 변수의 평균, 표준편차 및 상호상관

| 변수 | M | SD | 1 | 2 | 3 | 4 | 5 | |------|------|------|-------|-------|-------|-------|---| | 1. 자기효능감 | 3.82 | 0.74 | — | | | | | | 2. 학업 동기 | 4.15 | 0.68 | .52** | — | | | | | 3. 주당 학습 시간 | 16.40 | 6.20 | .38** | .45** | — | | | | 4. 시험 불안 | 2.90 | 0.85 | -.41** | -.33** | -.18 | — | | | 5. 최종 학점 | 3.24 | 0.55 | .47** | .51** | .42** | -.39** | — |

Note. N = 120.

* p < .05. ** p < .01. *** p < .001.

주요 형식 관행

하삼각행렬만 제시. 상관행렬은 대칭이므로 상삼각과 하삼각을 모두 보고하는 것은 중복입니다. 대각선 아래의 값만 제시하고 대각선에는 엠 대시(—)를 배치합니다. 일부 학술지에서는 대각선에 1.00을 보고하는 것도 허용하지만, 대시 관행이 더 일반적입니다.

유의성 별표. 일관된 별표 체계를 사용합니다: p < .05에 별표 하나, p < .01에 두 개, 선택적으로 p < .001에 세 개. 모든 별표는 표 주석에서 정의해야 합니다. 한 논문 내에서 별표 관행을 혼용하지 마십시오.

기술통계 포함. M과 SD 열을 추가하면 독자가 본문을 뒤질 필요가 없습니다. 변수가 서로 다른 척도를 사용하는 경우, 각 측정도구의 범위나 문항 수도 추가하는 것을 고려하십시오.

변수 번호 매기기. 행 변수에 번호를 매기고(1, 2, 3, ...) 해당 번호를 열 머리글로 사용합니다. 이렇게 하면 표가 간결해지고 어떤 상관이 어떤 쌍에 해당하는지 즉시 알 수 있습니다.

앞의 0 생략. 표 내의 모든 상관 값은 APA의 앞의 0 생략 규칙을 따라야 합니다(예: 0.52가 아닌 .52).

유의한 값 굵게 표시. 일부 학술지와 지도교수는 별표 외에 유의한 상관을 굵게 표시하는 것을 선호합니다. 대상 학술지의 지침을 확인하십시오.

상관 보고의 흔한 함정

경험 많은 연구자도 상관을 보고할 때 실수를 범합니다. 앞서 다룬 형식적 실수 외에도 연구 결과의 타당성을 손상시킬 수 있는 여러 실질적 함정이 있습니다.

상관과 인과의 혼동

이것은 통계 교육에서 가장 자주 인용되는 오류이지만, 여전히 출판된 연구에 나타납니다. "스크린 타임이 독해력을 감소시켰다"라고 말하는 것은 인과를 암시하지만, 상관은 인과적 연결을 확립할 수 없습니다. 독해력이 낮은 아이들이 스크린에 더 끌리거나, 부모의 참여 같은 제3변수가 둘 다를 유발할 수 있습니다. 항상 관련성 언어를 사용하십시오: "~와 관련이 있었다", "~와 연관되었다", "예측하였다(통계적 의미에서, 인과적이 아닌)".

비선형 관계 확인 안 함

Pearson r은 선형 관계만 측정합니다. 두 변수가 강한 곡선적 관련성을 가진 경우 — 예를 들어 각성 수준과 수행 간의 역U자 관계(Yerkes-Dodson 법칙) — 강한 관계가 있음에도 Pearson 상관은 거의 0에 가까울 수 있습니다. 상관을 계산하기 전에 항상 산점도를 검토하십시오. 패턴이 명확히 비선형이면 데이터 변환이나 거리 상관 같은 비선형 관련성 측정치를 사용하는 것을 고려하십시오.

r에 대한 이상값 효과 무시

단일 이상값이 Pearson 상관을 극적으로 변화시킬 수 있습니다. 작은 표본에서 하나의 이탈 데이터 점이 r을 거의 0에서 .50 이상으로, 또는 그 반대로 바꿀 수 있습니다. 최선의 관행은 이상값을 포함한 상관과 제외한 상관을 모두 보고하는 것입니다. 한두 점을 제거하면 r이 실질적으로 변하는 경우 결과 섹션에 이를 기재하고 함의를 논의하십시오. Spearman r_s는 순위 기반 접근법이 이상값 영향을 최소화하므로 유용한 대안입니다.

보정 없이 너무 많은 상관 보고

10개 변수로 이루어진 상관행렬은 45개의 고유한 상관을 산출합니다. 유의수준 .05에서 약 두세 개가 우연만으로도 통계적 유의성에 도달할 것으로 예상됩니다. 많은 상관을 동시에 검토할 때는 Bonferroni 보정(비교 횟수로 알파 수준을 나누기)을 적용하거나 결과를 탐색적으로 보고하는 것을 고려하십시오. 보정 없이는 제1종 오류(거짓 양성)의 위험이 급격히 증가합니다.

신뢰구간 미보고

APA 7판은 상관계수에 대한 신뢰구간을 강력히 권장하지만, 많은 연구자가 이를 누락합니다. 신뢰구간은 추정치의 정밀도에 대한 중요한 정보를 제공합니다. 95% CI가 [.12, .62]인 r = .40은 CI가 [.35, .45]인 r = .40과 매우 다른 이야기를 전합니다. 전자는 상당한 불확실성을 시사하고, 후자는 매우 정밀한 추정치를 나타냅니다. CI 보고에 대한 자세한 내용은 다음 섹션을 참조하십시오.

상관의 신뢰구간

APA 7판은 상관계수와 함께 신뢰구간(CI)을 보고하도록 권장합니다. CI는 상관이 얼마나 정밀하게 추정되었는지를 전달하며, 유의/비유의의 이분법적 틀을 넘어 결과의 실질적 유의성을 평가하는 데 도움을 줍니다.

신뢰구간이 포함된 상관의 APA 형식

권장 형식은 CI를 보고에 직접 통합합니다:

r(df) = .XX, 95% CI [.XX, .XX], p = .XXX

전체 보고 예시:

마음챙김 수련 빈도와 지각된 스트레스 간의 관계를 평가하기 위해 Pearson 상관을 산출하였다. 통계적으로 유의한 부적 상관이 있었다, r(48) = -.42, 95% CI [-.63, -.16], p = .003. 마음챙김 수련 빈도가 높을수록 지각된 스트레스 수준이 낮은 것과 관련되었다.

신뢰구간의 계산 방법: Fisher z 변환

상관계수는 -1과 +1 사이에 제한되며, 표집 분포는 비대칭입니다(특히 0에서 먼 값의 경우). 신뢰구간을 구성하기 위해 상관은 먼저 Fisher z 변환을 사용하여 변환되며, 이는 표집 분포를 정규화합니다:

z = 0.5 × ln[(1 + r) / (1 - r)]

z의 표준오차는 1 / sqrt(N - 3)입니다. z 척도에서 CI를 계산한 후, 끝점을 다시 r 척도로 변환합니다. 이 절차는 진정한 상관이 0에서 먼 경우에도 정확한 CI를 생성합니다.

이 변환을 수작업으로 수행할 필요는 없습니다 — 대부분의 통계 소프트웨어와 온라인 계산기(StatMate 포함)가 자동으로 처리합니다.

넓은 CI와 좁은 CI 해석

좁은 CI(예: r = .45, 95% CI [.38, .51])는 정밀한 추정치를 나타내며, 일반적으로 큰 표본 크기에서 비롯됩니다. 독자는 진정한 모집단 상관이 이 좁은 범위 내에 있다고 상당히 확신할 수 있습니다.

넓은 CI(예: r = .45, 95% CI [.10, .70])는 상당한 불확실성을 나타냅니다. 점 추정치는 중간 정도의 상관을 시사하지만, 진정한 값은 작은 것에서 큰 것까지 어디에든 있을 수 있습니다. 넓은 CI는 일반적으로 작은 표본 크기에서 비롯되며, 결과를 주의해서 해석하고 더 큰 표본으로 반복할 필요가 있음을 신호합니다.

일반적 지침으로, CI 너비는 표본 크기가 증가함에 따라 감소합니다. N = 30에 기반한 상관은 N = 200에 기반한 동일한 상관보다 훨씬 넓은 CI를 가집니다.

신뢰구간이 p값보다 중요한 이유

p 값은 상관이 0과 통계적으로 구별 가능한지만 알려줍니다. CI는 모집단 상관의 가능한 범위를 알려줍니다. 두 연구 모두 p < .05로 r = .30을 발견할 수 있지만, 하나의 CI가 [.05, .52]이고 다른 하나가 [.22, .37]이면, 두 번째 연구가 의미 있는 효과에 대해 훨씬 강력한 증거를 제공합니다. 이것이 APA 7판이 CI를 유의성 검정의 더 유익한 보완으로 강조하는 이유입니다.

자주 묻는 질문

Pearson 상관과 Spearman 상관의 차이는 무엇인가요?

Pearson r은 두 개의 연속적이고 정규분포를 따르는 변수 간의 선형 관계의 강도를 측정합니다. 등간 또는 비율 측정 척도를 가정하며 이상값에 민감합니다. Spearman r_s는 데이터를 순위로 변환하고 단조적 관계의 강도를 측정합니다. 서열 데이터, 비정규 분포, 또는 이상값이 존재할 때 적합합니다. 두 계수 모두 -1에서 +1의 범위를 가지며 해석에 동일한 Cohen 기준을 사용합니다. 모수적 가정을 충족하면 Pearson을, 그렇지 않으면 Spearman을 선택하십시오.

상관이 정확히 0이 될 수 있나요?

이론적으로 r = 0은 선형 관계가 전혀 없음을 나타냅니다. 실제로 표본 상관은 무선 표집 변동성 때문에 거의 정확히 0이 되는 경우가 없습니다. 모집단에서 두 변수가 완전히 무관하더라도 표본은 일반적으로 작은 비영 상관(예: r = .03 또는 r = -.05)을 산출합니다. 이러한 값은 비유의한 p 값과 함께 제시될 때 의미 있는 관계가 없는 것으로 해석됩니다.

유의하지 않은 상관은 어떻게 보고하나요?

유의한 결과와 정확히 동일한 형식을 사용합니다. 발견을 진술하고, 통계를 보고하며, 간단한 해석을 제공하십시오:

일일 수분 섭취량과 시험 점수 간에 통계적으로 유의한 상관은 없었다, r(48) = .12, p = .410.

유의성에 관계없이 항상 효과크기를 포함하십시오. 유의하지 않은 상관을 결과 섹션이나 상관행렬에서 누락하지 마십시오.

상관분석에는 어느 정도의 표본 크기가 필요한가요?

필요한 표본 크기는 예상 효과크기와 원하는 통계적 검정력에 따라 달라집니다. 알파 = .05와 검정력 = .80의 표준 관행을 사용할 때: 큰 상관(r = .50)을 탐지하려면 약 29명, 중간 상관(r = .30)에는 약 85명, 작은 상관(r = .10)에는 약 782명이 필요합니다. 이 수치는 작은 효과에 실질적으로 더 큰 표본이 필요한 이유를 보여줍니다. StatMate의 표본크기 계산기 같은 도구를 사용하여 데이터 수집 전에 항상 검정력 분석을 수행하십시오.

범주형 변수를 상관분석할 수 있나요?

Pearson과 Spearman 상관은 최소 서열 데이터를 필요로 합니다. 두 개의 명목(비순서 범주형) 변수에는 카이제곱 검정에서 산출되는 Cramer's V 또는 phi 계수를 사용합니다. 하나의 이분 변수와 하나의 연속 변수에는 점이연 상관(r_pb)을 사용하며, 이는 하나의 변수가 정확히 두 범주를 가질 때 Pearson r과 수학적으로 동일합니다. 하나의 서열 변수와 하나의 연속 변수에는 Spearman r_s가 적합합니다.

r²는 r이 알려주지 않는 무엇을 알려주나요?

결정계수(r²)는 두 변수 간의 공유 분산 비율을 나타냅니다. r = .50은 중간 정도의 관계처럼 들리지만, 이를 제곱하면 r² = .25로 한 변수의 분산의 25%만이 다른 변수에 의해 설명됨을 알 수 있습니다. 이는 실질적 유의성의 더 직관적인 측정치를 제공합니다. 예를 들어, r = .30은 r² = .09에 해당하며, 이는 단지 9%의 공유 분산을 나타냅니다 — 이것이 연구 맥락에 따라 실질적으로 의미 있을 수도, 그렇지 않을 수도 있습니다.

상관에서 단측 검정과 양측 검정 중 어느 것을 사용해야 하나요?

데이터 수집 전에 관계의 특정 방향을 예측할 강력한 이론적 또는 경험적 근거가 없는 한 양측 검정을 기본으로 사용하십시오. 단측 검정은 예측된 방향의 효과를 탐지하는 통계적 검정력을 높이지만, 반대 방향의 효과는 완전히 놓칩니다. 대부분의 학술지는 양측 검정을 기대하며, 심사위원은 서론에서 방향적 가설이 충분히 정당화되지 않는 한 단측 검정에 의문을 제기할 수 있습니다.

상관분석에서 이상값은 어떻게 처리하나요?

먼저 산점도를 검토하여 잠재적 이상값을 시각적으로 확인합니다. 이상값이 존재하면 다단계 접근법을 따르십시오. 첫째, 이상값이 데이터 입력 오류가 아닌지 확인합니다. 둘째, 이상값을 포함한 상관과 제외한 상관을 모두 계산합니다. 이상값을 제거하면 r이 실질적으로 변하는 경우 두 값을 모두 보고하고 함의를 논의합니다. 셋째, 원시 값이 아닌 순위에 기반하여 작동하므로 이상값에 훨씬 덜 민감한 Spearman 상관을 사용하는 것을 고려합니다. 정당한 근거와 투명한 보고 없이 이상값을 조용히 제거하지 마십시오.

StatMate의 무료 상관분석 계산기를 사용해 보세요

상관분석 결과를 수작업으로 포맷하는 것은 번거롭고 오류가 발생하기 쉽습니다. StatMate의 상관분석 계산기는 전체 과정을 자동화합니다.

두 변수를 입력하면 StatMate가 즉시 계산합니다:

정확한 p값이 포함된 Pearson r
결정계수 (r²)
r에 대한 95% 신뢰구간
회귀선이 포함된 산점도
논문에 바로 복사할 수 있는 APA 형식 결과

출력은 이 가이드에서 다룬 모든 APA 7판 관행을 따릅니다 — 올바른 소수점 자릿수, 앞의 0 생략, 자유도, 일상적 언어 해석. 포맷된 텍스트를 직접 복사하거나 클릭 한 번으로 Word(.docx)로 내보낼 수 있습니다.

APA에서 상관분석 보고의 기본

Pearson 상관 보고

APA 템플릿

주요 형식 규칙

전체 보고 예시

r²를 포함해야 할 때

상관 강도 해석

상관행렬 보고(표 형식)

APA 상관표 템플릿

표 형식 규칙

Spearman 순위상관 보고

Spearman을 사용해야 할 때

APA 템플릿과 예시

점이연 상관

APA 템플릿과 예시

유의하지 않은 상관

유의하지 않은 결과를 보고하는 이유

예시

흔한 실수

명확한 설명 없이 r 대신 r² 보고

기술에서 상관과 인과 혼동

자유도 미보고

r과 p 값에 앞의 0 사용

표에서 유의하지 않은 상관 누락

상관 유형 명시 실패

APA 상관 보고 체크리스트

Spearman 상관을 APA 형식으로 보고하기

Spearman이 적절한 선택인 경우

Spearman 상관의 APA 형식

Pearson과 Spearman의 주요 차이

편상관: 혼입변수 통제

편상관이 중요한 이유

편상관의 APA 형식

편상관과 영차 상관 중 어느 것을 보고할지

APA 표 형식의 상관행렬

상관행렬을 사용해야 할 때

완전한 APA 상관행렬 예시

주요 형식 관행

상관 보고의 흔한 함정

상관과 인과의 혼동

비선형 관계 확인 안 함

r에 대한 이상값 효과 무시

보정 없이 너무 많은 상관 보고

신뢰구간 미보고

상관의 신뢰구간

신뢰구간이 포함된 상관의 APA 형식

신뢰구간의 계산 방법: Fisher z 변환

넓은 CI와 좁은 CI 해석

신뢰구간이 p값보다 중요한 이유

자주 묻는 질문

Pearson 상관과 Spearman 상관의 차이는 무엇인가요?

상관이 정확히 0이 될 수 있나요?

유의하지 않은 상관은 어떻게 보고하나요?

상관분석에는 어느 정도의 표본 크기가 필요한가요?

범주형 변수를 상관분석할 수 있나요?

r²는 r이 알려주지 않는 무엇을 알려주나요?

상관에서 단측 검정과 양측 검정 중 어느 것을 사용해야 하나요?

상관분석에서 이상값은 어떻게 처리하나요?

StatMate의 무료 상관분석 계산기를 사용해 보세요

지금 바로 계산해 보세요

통계 분석 팁 받아보기