相関分析はいつ使用しますか？

2つの連続型変数間の線形関係の強さと方向を測定する場合に使用します。例：学習時間と試験スコアの関係。

PearsonとSpearman相関の違いは何ですか？

Pearson相関は2つの変数の線形関係を測定し、正規性の仮定が必要です。Spearman相関は順位に基づいており、非線形の単調関係も検出でき、正規性の仮定は不要です。

相関係数rはどのように解釈しますか？

|r| < 0.3は弱い相関、0.3〜0.7は中程度の相関、0.7以上は強い相関です。rが正なら正の相関（一方が増加するともう一方も増加）、負なら負の相関です。

相関関係は因果関係を意味しますか？

いいえ。相関関係は2つの変数が共に変化する傾向を示すだけであり、一方の変数がもう一方を「引き起こす」ことを証明するものではありません。第3の変数が関与している可能性があります。

相関分析計算ツール

2変数間のピアソンrまたはスピアマンρを計算します。散布図、p値、APA形式の結果を含みます。

相関分析とは？

相関分析は、2つの変数間の関係の強さと方向を定量化する統計的測定方法です。相関係数は-1（完全な負の関係）から+1（完全な正の関係）までの範囲を持ち、 0は線形関係がないことを示します。相関分析は、心理学、教育学、医学、経済学、社会科学において最も広く使用される手法の1つです。

相関の概念は、Sir Francis Galtonが1880年代に遺伝と平均への回帰に関する研究で先駆的に取り組みました。彼の研究は Karl Pearsonによって体系化され、1896年に今日まで使用されている数学的基盤である積率相関係数（Pearsonのr）を開発しました。1904年にはCharles Spearmanが順序データと単調関係のためのノンパラメトリックな代替法である順位相関係数（Spearmanのrho）を導入しました。この2つの指標が現代の二変量相関分析の基盤を形成しています。

Pearson相関（r）

Pearsonのrは、2つの連続型変数間の線形関係の強さを測定します。2つの変数の共分散をそれぞれの標準偏差の積で割って計算されます。両方の変数が間隔尺度または比率尺度で測定され、関係がおおよそ線形であり、データがおおよそ正規分布に従う場合にPearsonを使用します。

Spearman相関（rho）

Spearmanのrho（r_s）は、生の値ではなく順位を使用して2つの変数間の単調関係を評価するノンパラメトリックな指標です。データが順序型（例：リッカート尺度）であるか、関係が単調であるが必ずしも線形ではない場合、または外れ値が懸念される場合にSpearmanを使用します。順位に基づいているため、Spearmanのrhoは Pearsonのrよりも極端値に対して頑健です。

計算例：学習時間 vs. 試験スコア

心理学の教授が、週間の学習時間が試験の成績を予測するかを調べるために 10名の学生のデータを収集しました。各学生は平均的な週間学習時間を報告し、期末試験のスコア（100点満点）が記録されました。

学習時間 (X)

2, 4, 6, 8, 10, 12, 14, 16, 18, 20

M = 11.00, SD = 6.06

試験スコア (Y)

52, 58, 61, 68, 72, 78, 81, 85, 90, 95

M = 74.00, SD = 14.23

散布図の説明

10個のデータポイントをグラフにプロットすると、明確な上昇傾向が見られます：学習時間が2時間から20時間に増加するにつれ、試験スコアが 52点から95点に上昇しています。データポイントは上向きの回帰線の周りに密集しており、散布が少ない強い正の線形関係を示しています。

結果

r(8) = .85, p < .001, 95% CI [.50, .96]

週間学習時間と試験スコアの間に強い正の相関が認められました。週当たりより多くの時間を勉強した学生は、期末試験でかなり高いスコアを獲得する傾向がありました。決定係数（r² = .72）は、学習時間が試験スコアの分散の約72%を説明することを示しています。

相関係数と他の検定の比較

正しい相関の方法を選択するには、データの種類、分布、および予想される関係の性質によって異なります。以下は選択を助けるための比較表です：

特性	Pearson r	Spearman r_s
種類	パラメトリック	ノンパラメトリック
データ水準	間隔 / 比率	順序 / 間隔 / 比率
検出される関係	線形のみ	すべての単調関係
正規性の要件	あり（二変量正規性）	なし
外れ値への感度	高い	より頑健
適している場合	連続型、正規分布のデータ	順位データ、非正規分布、順序尺度
使用例	身長 vs. 体重	顧客満足度（1-5） vs. 再購入頻度

相関の強さの解釈

相関係数の絶対値は関係の強さを示します。文脈が重要であり分野によって基準が異なりますが、以下のガイドライン（Evans, 1996に基づく）は一般的な枠組みを提供します：

\|r\| の値	強さ	解釈
.00 – .19	無視できる水準	無視できる関係；実質的な予測価値なし
.20 – .39	弱い	小さいが潜在的に意味のある関係
.40 – .59	中程度	顕著な関係で意味のある予測力を持つ
.60 – .79	強い	実質的な関係；良好な予測精度
.80 – 1.00	非常に強い	ほぼ完全な関係；優れた予測精度

注意：これらの基準は正の相関と負の相関の両方に同等に適用されます。 r = -.85はr = +.85と同じ強さであり、方向のみが異なります。

相関分析の前提条件

相関の結果を解釈する前に、以下の前提条件が満たされているか確認してください：

1. 連続型データ

Pearsonのrを使用するには、両方の変数が連続型尺度（間隔尺度または比率尺度）で測定されている必要があります。どちらかの変数が順序型（例：リッカート尺度、順位）の場合は、順位に基づいて計算され連続型の測定を必要としないSpearmanのrhoを使用してください。

2. 線形性

Pearsonのrは2つの変数間の線形関係を仮定します。常にまず散布図を確認してください。関係が曲線的（例：U字型や対数的）な場合、 Pearsonのrは実際の関連性の強さを過小評価します。このような場合はSpearmanのrhoや非線形変換を検討してください。

3. 二変量正規性（Pearsonのみ）

Pearsonのrは、両方の変数がおおよそ正規分布に従うことを仮定します。この仮定は主に有意性検定と信頼区間に重要です。標本サイズが30以上であれば、中程度の違反に対しても検定は十分に頑健です。非正規データの場合は、Spearmanのrhoを代わりに使用してください。

4. 外れ値がないこと

外れ値はPearsonのrを劇的に上昇または低下させる可能性があります。たった1つの極端なデータポイントが、相関をほぼ0から強い水準に（またはその逆に）移動させることがあります。常に散布図でデータを視覚化して外れ値を確認してください。外れ値がある場合は、根拠を示して除去するか、Spearmanのrhoに切り替えることを検討してください。

相関は因果ではない

統計学において最も重要な原則の1つは、 相関は因果を意味しないということです。2つの変数間の強い相関は、それらが共に変化する傾向があることを意味しますが、一方の変数がもう一方の変化を引き起こしていることを証明するものではありません。

観測された相関に対して3つの可能な説明があります：

直接的因果： XがYを実際に引き起こしている（またはYが Xを引き起こしている）。
逆因果： 因果の方向があなたの仮定とは逆である。
第3変数（交絡変数）： 測定されていない変数ZがXとY の両方を引き起こし、見かけ上の相関を生み出している。

典型的な例： アイスクリームの売上と溺死事故の件数には強い正の相関があります。アイスクリームが溺死を引き起こすのでしょうか？もちろんそうではありません。交絡変数は気温です—暑い天気がアイスクリームの消費と水泳活動の両方を増加させ、溺死事故が増えるのです。気温を制御しなければ、アイスクリームと溺死の間に因果関係があると誤った結論を導いてしまいます。

因果関係を確立するには、無作為割り当てを含む適切に設計された実験研究、または操作変数法、回帰不連続デザイン、差分の差分法などの高度な手法が必要です。

APA形式による報告方法

APA第7版のガイドラインによると、相関の結果報告には相関係数、自由度（N - 2）、p値、できれば95%信頼区間を含める必要があります。以下は実際の数値を含むテンプレートです：

Pearson相関

週間学習時間と試験スコアの関係を評価するためにPearson相関分析を実施した。2つの変数間に強い正の相関が認められた、 r(8) = .85, p < .001, 95% CI [.50, .96]。週当たりより多くの時間を勉強した学生ほど、より高い試験スコアを獲得する傾向があった。

Spearman相関

顧客満足度評価と再購入頻度の関係を評価するためにSpearman順位相関分析を実施した。中程度の正の相関が認められた、 r_s(48) = .52, p < .001。より高い満足度を報告した顧客ほど、より頻繁に再購入する傾向があった。

注意：相関係数は先頭の0を付けずに小数点以下2桁まで報告します（例： 0.87ではなく .87）。p値は小数点以下3桁まで報告し、.001未満の場合は p < .001と表記します。相関の自由度はN - 2です。

よくある間違い

相関と因果の混同： 有意な相関は2つの変数が関連していることのみを示し、一方の変数がもう一方を引き起こすことを意味しません。常に交絡変数を考慮し、因果的な表現を避けてください（例：「〜に起因する」ではなく「〜と関連がある」を使用）。
外れ値の無視： 1つの外れ値がPearsonのrを劇的に変化させる可能性があります。例えば、1つの極端なデータポイントが弱い相関を強い相関に（またはその逆に）変えることがあります。結果を報告する前に、常に散布図を確認してください。
範囲の制限： 標本が一方の変数の狭い範囲のみを含む場合、観測される相関は弱められます（減衰）。例えば、入学した大学院生（すでに両変数とも高い）の間でGPAとGREスコアを相関分析すると、実際の母集団における相関を過小評価してしまいます。
非線形データへのPearsonの使用： Pearsonのrは線形関係のみを捉えます。散布図が明確な曲線（例：二次関数、対数関数）を示している場合、Pearsonのrは実際の関連性を過小評価します。 Spearmanのrhoを使用するか、データを変換してください。
p = .000と報告する： 統計ソフトウェアが p = .000と表示することがあります。常に p < .001と報告してください。p値は決して正確に0ではありません。

計算精度

StatMateの相関計算は、Rの cor.test() 関数に対して検証されています。Pearsonのrは標準的な積率公式を、 Spearmanのrhoは順位値を使用して計算します。有意性検定は N - 2自由度のt分布を使用します。Pearsonのrの 95%信頼区間はFisherのz変換を通じて計算されます。すべての結果はR出力と小数点以下4桁まで一致します。

他の計算ツールを試す

t検定

2群の平均値を比較

分散分析

3群以上の平均値を比較

カイ二乗検定

カテゴリ変数の関連を検定

記述統計

データを要約

サンプルサイズ

検出力分析・標本計画

1標本t検定

既知の値との比較

マン・ホイットニーU

ノンパラメトリック群間比較

ウィルコクソン検定

ノンパラメトリック対応検定

回帰分析

X-Yの関係をモデル化

重回帰分析

複数の予測変数

クロンバックのα

尺度の信頼性

ロジスティック回帰

二値アウトカムの予測

因子分析

潜在因子構造の探索

クラスカル・ウォリス

ノンパラメトリック3群以上比較

反復測定

被験者内分散分析

二元配置分散分析

要因計画の分析

フリードマン検定

ノンパラメトリック反復測定

フィッシャーの正確検定

2×2表の正確検定

マクネマー検定

対応のある名義データの検定

相関分析計算ツール

相関分析とは？

Pearson相関（r）

Spearman相関（rho）

計算例：学習時間 vs. 試験スコア

相関係数と他の検定の比較

相関の強さの解釈

相関分析の前提条件

相関は因果ではない

APA形式による報告方法

よくある間違い

計算精度

他の計算ツールを試す

関連ガイドをもっと見る

相関分析計算ツール

相関分析とは？

Pearson相関（r）

Spearman相関（rho）

計算例：学習時間 vs. 試験スコア

相関係数と他の検定の比較

相関の強さの解釈

相関分析の前提条件

相関は因果ではない

APA形式による報告方法

よくある間違い

計算精度

他の計算ツールを試す

関連ガイドをもっと見る