2変数間のピアソンrまたはスピアマンρを計算します。散布図、p値、APA形式の結果を含みます。
相関分析は、2つの変数間の関係の強さと方向を定量化する統計的測定方法です。 相関係数は-1(完全な負の関係)から+1(完全な正の関係)までの範囲を持ち、 0は線形関係がないことを示します。相関分析は、心理学、教育学、医学、 経済学、社会科学において最も広く使用される手法の1つです。
相関の概念は、Sir Francis Galtonが1880年代に遺伝と 平均への回帰に関する研究で先駆的に取り組みました。彼の研究は Karl Pearsonによって体系化され、1896年に今日まで 使用されている数学的基盤である積率相関係数(Pearsonのr)を 開発しました。1904年にはCharles Spearmanが順序データと 単調関係のためのノンパラメトリックな代替法である順位相関係数(Spearmanのrho)を導入しました。この2つの指標が現代の二変量相関分析の 基盤を形成しています。
Pearsonのrは、2つの連続型変数間の線形関係の 強さを測定します。2つの変数の共分散をそれぞれの標準偏差の積で割って 計算されます。両方の変数が間隔尺度または比率尺度で測定され、関係が おおよそ線形であり、データがおおよそ正規分布に従う場合にPearsonを 使用します。
Spearmanのrho(rs)は、生の値ではなく 順位を使用して2つの変数間の単調関係を評価するノン パラメトリックな指標です。データが順序型(例:リッカート尺度)であるか、 関係が単調であるが必ずしも線形ではない場合、または外れ値が懸念される 場合にSpearmanを使用します。順位に基づいているため、Spearmanのrhoは Pearsonのrよりも極端値に対して頑健です。
心理学の教授が、週間の学習時間が試験の成績を予測するかを調べるために 10名の学生のデータを収集しました。各学生は平均的な週間学習時間を 報告し、期末試験のスコア(100点満点)が記録されました。
学習時間 (X)
2, 4, 6, 8, 10, 12, 14, 16, 18, 20
M = 11.00, SD = 6.06
試験スコア (Y)
52, 58, 61, 68, 72, 78, 81, 85, 90, 95
M = 74.00, SD = 14.23
散布図の説明
10個のデータポイントをグラフにプロットすると、明確な上昇傾向が 見られます:学習時間が2時間から20時間に増加するにつれ、試験スコアが 52点から95点に上昇しています。データポイントは上向きの回帰線の 周りに密集しており、散布が少ない強い正の線形関係を示しています。
結果
r(8) = .85, p < .001, 95% CI [.50, .96]
週間学習時間と試験スコアの間に強い正の相関が認められました。 週当たりより多くの時間を勉強した学生は、期末試験でかなり高い スコアを獲得する傾向がありました。決定係数(r2 = .72)は、学習時間が試験スコアの分散の約72%を説明することを 示しています。
正しい相関の方法を選択するには、データの種類、分布、および予想される 関係の性質によって異なります。以下は選択を助けるための比較表です:
| 特性 | Pearson r | Spearman rs |
|---|---|---|
| 種類 | パラメトリック | ノンパラメトリック |
| データ水準 | 間隔 / 比率 | 順序 / 間隔 / 比率 |
| 検出される関係 | 線形のみ | すべての単調関係 |
| 正規性の要件 | あり(二変量正規性) | なし |
| 外れ値への感度 | 高い | より頑健 |
| 適している場合 | 連続型、正規分布のデータ | 順位データ、非正規分布、順序尺度 |
| 使用例 | 身長 vs. 体重 | 顧客満足度(1-5) vs. 再購入頻度 |
相関係数の絶対値は関係の強さを示します。文脈が重要であり分野によって 基準が異なりますが、以下のガイドライン(Evans, 1996に基づく)は一般的な 枠組みを提供します:
| |r| の値 | 強さ | 解釈 |
|---|---|---|
| .00 – .19 | 無視できる水準 | 無視できる関係;実質的な予測価値なし |
| .20 – .39 | 弱い | 小さいが潜在的に意味のある関係 |
| .40 – .59 | 中程度 | 顕著な関係で意味のある予測力を持つ |
| .60 – .79 | 強い | 実質的な関係;良好な予測精度 |
| .80 – 1.00 | 非常に強い | ほぼ完全な関係;優れた予測精度 |
注意:これらの基準は正の相関と負の相関の両方に同等に適用されます。 r = -.85はr = +.85と同じ強さであり、方向のみが 異なります。
相関の結果を解釈する前に、以下の前提条件が満たされているか確認してください:
1. 連続型データ
Pearsonのrを使用するには、両方の変数が連続型尺度(間隔尺度 または比率尺度)で測定されている必要があります。どちらかの変数が 順序型(例:リッカート尺度、順位)の場合は、順位に基づいて計算され 連続型の測定を必要としないSpearmanのrhoを使用してください。
2. 線形性
Pearsonのrは2つの変数間の線形関係を仮定します。常にまず 散布図を確認してください。関係が曲線的(例:U字型や対数的)な場合、 Pearsonのrは実際の関連性の強さを過小評価します。このような 場合はSpearmanのrhoや非線形変換を検討してください。
3. 二変量正規性 (Pearsonのみ)
Pearsonのrは、両方の変数がおおよそ正規分布に従うことを 仮定します。この仮定は主に有意性検定と信頼区間に重要です。標本 サイズが30以上であれば、中程度の違反に対しても検定は十分に頑健です。 非正規データの場合は、Spearmanのrhoを代わりに使用してください。
4. 外れ値がないこと
外れ値はPearsonのrを劇的に上昇または低下させる可能性が あります。たった1つの極端なデータポイントが、相関をほぼ0から強い 水準に(またはその逆に)移動させることがあります。常に散布図で データを視覚化して外れ値を確認してください。外れ値がある場合は、 根拠を示して除去するか、Spearmanのrhoに切り替えることを検討して ください。
統計学において最も重要な原則の1つは、 相関は因果を意味しないということです。2つの変数間の 強い相関は、それらが共に変化する傾向があることを意味しますが、一方の 変数がもう一方の変化を引き起こしていることを証明するものではありません。
観測された相関に対して3つの可能な説明があります:
典型的な例: アイスクリームの売上と溺死事故の件数には 強い正の相関があります。アイスクリームが溺死を引き起こすのでしょうか? もちろんそうではありません。交絡変数は気温です—暑い 天気がアイスクリームの消費と水泳活動の両方を増加させ、溺死事故が 増えるのです。気温を制御しなければ、アイスクリームと溺死の間に因果関係が あると誤った結論を導いてしまいます。
因果関係を確立するには、無作為割り当てを含む適切に設計された実験研究、 または操作変数法、回帰不連続デザイン、差分の差分法などの高度な手法が 必要です。
APA第7版のガイドラインによると、相関の結果報告には相関係数、自由度 (N - 2)、p値、できれば95%信頼区間を含める必要があります。以下は 実際の数値を含むテンプレートです:
Pearson相関
週間学習時間と試験スコアの関係を評価するためにPearson相関分析を 実施した。2つの変数間に強い正の相関が認められた、 r(8) = .85, p < .001, 95% CI [.50, .96]。 週当たりより多くの時間を勉強した学生ほど、より高い試験スコアを 獲得する傾向があった。
Spearman相関
顧客満足度評価と再購入頻度の関係を評価するためにSpearman順位 相関分析を実施した。中程度の正の相関が認められた、 rs(48) = .52, p < .001。 より高い満足度を報告した顧客ほど、より頻繁に再購入する傾向があった。
注意:相関係数は先頭の0を付けずに小数点以下2桁まで報告します(例: 0.87ではなく .87)。p値は小数点以下3桁まで報告し、.001未満の 場合は p < .001と表記します。相関の自由度はN - 2です。
StatMateの相関計算は、Rの cor.test() 関数に対して検証されています。Pearsonのrは標準的な積率公式を、 Spearmanのrhoは順位値を使用して計算します。有意性検定は N - 2自由度のt分布を使用します。Pearsonのrの 95%信頼区間はFisherのz変換を通じて計算されます。すべての 結果はR出力と小数点以下4桁まで一致します。
t検定
2群の平均値を比較
分散分析
3群以上の平均値を比較
カイ二乗検定
カテゴリ変数の関連を検定
記述統計
データを要約
サンプルサイズ
検出力分析・標本計画
1標本t検定
既知の値との比較
マン・ホイットニーU
ノンパラメトリック群間比較
ウィルコクソン検定
ノンパラメトリック対応検定
回帰分析
X-Yの関係をモデル化
重回帰分析
複数の予測変数
クロンバックのα
尺度の信頼性
ロジスティック回帰
二値アウトカムの予測
因子分析
潜在因子構造の探索
クラスカル・ウォリス
ノンパラメトリック3群以上比較
反復測定
被験者内分散分析
二元配置分散分析
要因計画の分析
フリードマン検定
ノンパラメトリック反復測定
フィッシャーの正確検定
2×2表の正確検定
マクネマー検定
対応のある名義データの検定
Excel/スプレッドシートから貼り付け、またはCSVファイルをドロップ
Excel/スプレッドシートから貼り付け、またはCSVファイルをドロップ
データを入力して「計算」をクリックしてください
または「サンプルデータを読み込む」をクリックしてお試しください