APA形式での相関報告の基本
相関分析は、社会科学や行動科学で最も広く使用されている統計手法の一つです。学習時間と試験得点の関係を調べる場合でも、ストレスと睡眠の質の関連を調査する場合でも、標準化された形式で結果を報告する必要があります。
APA第7版では、相関の報告に相関係数、自由度(またはサンプルサイズ)、p値を含めることが求められています。相関の種類によっては、決定係数(r²)と信頼区間も報告する場合があります。これらの詳細を正しく記載することが、出版可能な原稿には不可欠です。
このガイドでは、Pearsonの r、Spearmanの r_s、点双列 r_pb、相関マトリックス、そして研究者が犯す最も一般的な書式上の間違いについて解説します。
Pearson相関の報告
Pearsonの積率相関係数は、2つの連続変数間の線形関係の強さと方向を測定します。両方の変数が間隔尺度または比率尺度で測定され、関係がほぼ線形である場合のデフォルトの相関手法です。
APAテンプレート
Pearson相関を報告するための標準的なAPA形式は以下のとおりです:
r(df) = .XX、p = .XXX
ここでdf(自由度)は N - 2 に等しくなります。例えば、参加者が50名の場合、df = 48 です。
主要な書式ルール
- 先行ゼロを付けない。 r は -1 から +1 の範囲に限定されるため、1.0を超えることがありません。したがってAPA形式では先行ゼロを省略します:r = 0.42 ではなく r = .42 と書きます。p 値にも同じルールが適用されます。
- r は小数点以下2桁。 相関係数は小数点以下2桁で報告します(例:.42。.4 や .4200 ではありません)。
- 正確な p 値。 正確な p 値を小数点以下3桁で報告します(例:p = .003)。値が .001 未満の場合のみ p < .001 を使用します。
- 自由度を括弧内に記載。 r の直後に必ず df = N - 2 を記載します。
完全な報告例
週あたりの学習時間と期末試験得点の関係を評価するためにPearson相関を計算しました。2つの変数間に統計的に有意な正の相関が認められました、r(48) = .42、p = .003。学習時間が長いと報告した学生ほど、試験で高い得点を取る傾向がありました。決定係数(r² = .18)は、学習時間が試験得点の分散の約18%を説明することを示しました。
構造に注目してください:分析の目的を述べ、統計結果を報告し、関係の方向を平易な言葉で説明し、必要に応じて追加の文脈として決定係数を提示します。
r²を含めるべき場合
決定係数(r²)は、一方の変数の分散のうち他方の変数によって説明される割合を読者に伝えます。r² の記載はAPAで厳密に求められているわけではありませんが、抽象的な相関係数を直感的なパーセンテージに変換するため、多くの学術誌で期待されています。r = .42 では実質的有意性がすぐにはわからないかもしれませんが、分散の18%が共有されていると述べれば、知見がより具体的になります。
相関の強さの解釈
Cohen(1988)は、相関係数の大きさを解釈するための広く使用されているベンチマークを提案しました。これらの指針は、符号に関係なく r の絶対値に適用されます。
| r の絶対値 | 解釈 | |-------------|------| | .10 - .29 | 小さい | | .30 - .49 | 中程度 | | .50以上 | 大きい |
r = -.55 の相関は大きな負の相関です。符号は方向(正または負)を示し、絶対値が強さを決定します。
注意点。 これらのベンチマークは慣習であり、厳格な基準ではありません。Cohen自身、より良い参照枠がない状況のためのガイドラインであると述べていました。研究分野によっては、r = .20 が意味のある実質的に重要な関係を表す場合もあれば、r = .50 が特筆すべきでないとみなされる場合もあります。常にあなたの分野の先行研究の文脈で相関を解釈してください。
例えば、パーソナリティ心理学では、性格特性と行動的結果の相関が .30 を超えることはめったにありません。その文脈では r = .25 は注目に値する知見です。物理学やエンジニアリングでは、測定誤差が最小限であるため、r = .25 は弱く実質的に些末な関係を示すかもしれません。
相関マトリックスの報告(表形式)
3つ以上の変数間の相関を検討する場合、相関マトリックス表に提示するのが標準的な方法です。APA形式にはこれらの表に関する固有の規約があります。
APA相関表テンプレート
Table 1
研究変数の平均値、標準偏差、および相互相関
| 変数 | M | SD | 1 | 2 | 3 | 4 | |------|------|------|-------|-------|-------|---| | 1. 学習時間 | 14.20 | 5.80 | — | | | | | 2. 試験得点 | 78.50 | 12.30 | .42** | — | | | | 3. 出席率 | 0.82 | 0.15 | .38** | .51** | — | | | 4. 睡眠の質 | 3.60 | 0.90 | .12 | .08 | .21* | — |
注. N = 50。M と SD はそれぞれ平均値と標準偏差を表します。
* p < .05. ** p < .01.
表の書式ルール
下三角のみ。 相関マトリックスは対称です。変数1と2の相関は、変数2と1の相関と同じです。両半分を報告するのは冗長です。下三角(対角線の下)のみを提示し、対角線にはダッシュを配置してください。
アスタリスク表記。 有意水準を示すためにアスタリスクを使用します。最も一般的な慣習は、p < .05 に1つのアスタリスク、p < .01 に2つのアスタリスクです。p < .001 に3つのアスタリスクを追加する研究者もいます。すべてのアスタリスクを表の注記で定義してください。
記述統計量を含める。 同じ表に平均値(M)と標準偏差(SD)の列を追加することで、読者が相関を評価するために必要なすべての情報を一箇所で確認できます。
変数の番号付け。 変数に番号を付け、それらの番号を列ヘッダーとして使用します。これにより表がコンパクトで読みやすくなります。
マトリックス内で先行ゼロを付けない。 表内のすべての r 値は、同じ先行ゼロなしのルールに従います。
Spearman順位相関の報告
Spearmanの順位相関係数(r_s またはギリシャ文字のrho)は、Pearsonの r のノンパラメトリックな代替手法です。2つの変数間の単調な関係の強さと方向を測定します。
Spearmanを使用すべき場合
Spearman相関は以下の場合に使用します:
- 一方または両方の変数が順序尺度で測定されている場合(例:リッカート評定、順位)。
- データにPearsonの r を歪める可能性のある著しい外れ値が含まれている場合。
- 関係が単調だが線形ではない場合(例:一方の変数が他方の増加とともに増加するが、一定の割合ではない)。
- 正規性の仮定が侵されており、サンプルサイズが小さい場合。
APAテンプレートと例
形式はPearsonとほぼ同じですが、区別するために下付き文字の s を使用します:
r_s(df) = .XX、p = .XXX
完全な例:
顧客満足度評定と再購入意向の関係を評価するために、Spearman順位相関を計算しました。2つの変数間に強い正の相関が認められました、r_s(78) = .61、p < .001。満足度評定が高いほど、再購入の意向が強い傾向がありました。
r_s の代わりにギリシャ文字のrhoを使用するスタイルガイドもあります。どちらの慣習も認められていますが、原稿全体で一貫してください。
点双列相関
点双列相関(r_pb)は、一方の変数が連続的で、もう一方が自然な二値(正確に2つのカテゴリを持つ)である場合に使用されます。テスト得点と合格/不合格の状態の相関や、給与と性別の関係の検討などが例として挙げられます。
APAテンプレートと例
r_pb(df) = .XX、p = .XXX
完全な例:
性別(0 = 女性、1 = 男性とコーディング)と数学的達成度の得点の関係を検討するために、点双列相関を計算しました。相関は統計的に有意でした、r_pb(98) = .31、p = .002。これは、男子生徒が女子生徒よりも平均的に高い得点を取ったことを示しています。
計算上、点双列相関は一方の変数が二値である場合のPearsonの r と同一です。その区別は主に概念的なものです。査読者や学術誌が r_pb のラベルを必要としない場合、標準的なPearsonの r として報告することも認められています。
有意でない相関
よくある間違いは、有意でない相関を結果セクションから省略することです。APAのガイドラインでは、統計的有意性に達したかどうかにかかわらず、計画されたすべての分析を報告することが求められています。
有意でない結果を報告する理由
有意でない結果は科学的記録に貢献します。出版バイアスを防止し、将来のメタ分析に情報を提供し、有意であった相関の解釈に重要な文脈を与えます。
例
1日のカフェイン摂取量とGPAの相関は統計的に有意ではありませんでした、r(48) = .12、p = .394。これは、このサンプルで観察された水準でのカフェイン消費は、学業成績と意味のある関連がなかったことを示唆しています。
形式は有意な結果と同一です。知見を明確に述べ、統計量を報告し、簡潔な解釈を提供してください。有意でない結果を謝罪したり無視したりしないでください。
相関マトリックスでは、有意でない相関はアスタリスクなしで表示されます。有意でない値を「ns」に置き換えたりセルを空白にしたりせず、常に実際の係数を報告してください。
よくある間違い
rの説明なしにr²を報告する
一部の研究者は、r を報告すべきところで r²(決定係数)を主要な統計量として報告します。この2つは異なる情報を伝えます。r = .50 は中程度に聞こえますが、対応する r² = .25 は分散の25%しか共有されていないことを示します。r² を報告する場合は、読者がそれが r ではなく r² であることを確認できるようにし、両方の報告を検討してください。
文章中で相関と因果関係を混同する
「学習時間が試験得点を向上させた」という表現は、相関では確立できない因果関係を暗示します。関連を反映する言葉を使用してください:「〜と関連していた」「〜との関係があった」「〜と共起する傾向があった」。因果関係を示す言葉は実験デザインの場合に限定してください。
自由度を報告しない
「r = .42、p = .003」と自由度なしで記載すると、重要な情報が欠落します。自由度によって読者はサンプルサイズ(N = df + 2)を特定し、分析の統計的検出力を評価できます。必ず記載してください。
rとp値に先行ゼロを使用する
r は -1 から +1 に、p は 0 から 1 に限定されるため、いずれも絶対値で1.0を超えることはありません。APA形式では先行ゼロの省略が求められます:r = 0.42 ではなく r = .42、p = 0.003 ではなく p = .003 と書いてください。
有意でない相関を表から省略する
2つの変数間の相関を検討した場合、有意性にかかわらずマトリックスに報告してください。有意な相関のみを選択的に報告することは、見かけ上の結果パターンを膨張させ、報告バイアスの一形態となります。
相関の種類を明記しない
PearsonではなくSpearman、または標準的なPearsonではなく点双列を使用した場合は、明示的に記載してください。Spearman相関を計算したのに「r = .45」とだけ書くと、読者がデフォルトでPearsonと判断してしまうため、誤解を招きます。
APA相関報告チェックリスト
原稿を提出する前にこのチェックリストを使用してください:
- [ ] 相関分析の目的を述べた
- [ ] 相関の種類を明記した(Pearson、Spearman、または点双列)
- [ ] 相関係数を小数点以下2桁で報告した
- [ ] 自由度を括弧内に含めた(df = N - 2)
- [ ] 正確な p 値を報告した(または p < .001)
- [ ] r と p 値の先行ゼロを省略した
- [ ] 関係の方向と強さを言葉で説明した
- [ ] 有意でないものを含め、計画されたすべての相関を報告した
- [ ] 効果量を含めた(r² またはCohenのベンチマークによる言語的解釈)
- [ ] 相関マトリックスを下三角のみとアスタリスク表記で書式設定した
- [ ] 有意性のアスタリスクとサンプルサイズを定義する表の注記を追加した
- [ ] 結果の記述に関連の言葉を使用した(因果の言葉ではなく)
Spearman相関をAPA形式で報告する
Pearsonの r が連続的で正規分布に従う変数間の線形関係を測定するのに対し、Spearmanの順位相関係数(r_s)はこれらの仮定が満たされない状況のために設計されています。順序データや非正規分布を扱う研究者にとって、Spearman相関の報告時期と方法を理解することは不可欠です。
Spearmanが適切な選択である場合
Spearman相関は生データを順位に変換してから相関を計算するため、いくつかの状況で頑健です。第一に、変数の一方または両方が順序尺度で測定されている場合——例えばリッカート型項目、満足度評定、クラス順位——Pearsonの r は間隔尺度または比率尺度のデータを要求するため、Spearmanが適切です。第二に、連続データに極端な外れ値が含まれている場合、Spearmanの順位ベースのアプローチはこれらの逸脱値に対してはるかに感度が低くなります。単一の外れ値がPearson相関を劇的に増大または減少させる可能性がありますが、Spearman係数にはほとんど影響しません。第三に、2つの変数間の関係が単調だが厳密には線形ではない場合、Spearmanはその関連をより正確に捉えます。例えば、教育水準に伴って所得が増加するが、増加率が一定でない場合、Spearmanがこのパターンをより適切に反映します。
Spearman相関のAPA形式
報告テンプレートはPearsonと同じ構造ですが、決定的な違いは下付き文字の s です:
r_s(df) = .XX、p = .XXX
完全な報告例:
痛みの重症度評定と日常の身体活動レベルの関係を検討するために、Spearman順位相関を計算しました。統計的に有意な負の相関が認められました、r_s(48) = -.38、p = .007。痛みの重症度が高いと報告した参加者は、低い水準の身体活動に従事する傾向がありました。
PearsonとSpearmanの主な違い
| 特徴 | Pearsonの r | Spearmanの r_s | |------|-------------|----------------| | データ型 | 連続(間隔/比率) | 順序または連続 | | 関係の型 | 線形 | 単調 | | 分布の仮定 | 正規(二変量) | なし | | 外れ値への感度 | 高い | 低い | | 効果量の解釈 | 同じCohenベンチマーク | 同じCohenベンチマーク |
迷った場合は、両方の係数を計算できます。PearsonとSpearmanが実質的に異なる値を生成する場合、非線形性や外れ値の存在が示唆され、Spearman係数がより信頼できる測定値である可能性が高いです。
偏相関:交絡変数の統制
偏相関は、1つ以上の追加変数の影響を統計的に除去した後の2つの変数間の関係を測定します。この手法は、交絡変数が関係の錯覚を作り出したり、実際の関係を隠したりする可能性のある観察研究において極めて重要です。
偏相関が重要な理由
アイスクリームの売上と溺水事故の間に強い正の相関を見つけたとしましょう。アイスクリームが溺水を引き起こすと結論づける前に、気温が両方の変数を駆動していることを考慮すべきです。気温を統制してアイスクリームの売上と溺水の偏相関を求めると、おそらくゼロに近づき、元の相関が見かけ上のものであったことが明らかになります。
行動研究における一般的な交絡変数には、年齢、社会経済的地位、教育水準、ベースラインの能力などがあります。これらの変数を統制しないと、誤解を招く結論に至る可能性があります。
偏相関のAPA形式
形式には、相関の種類、自由度(ここでは N - 2 - k、k は統制された変数の数)、係数、p 値、および統制された変数の明確な記述が含まれます:
r(47) = .35、p = .014、年齢を統制
自由度は統制された変数ごとに1ずつ減少します。参加者50名で統制変数1つの場合:df = 50 - 2 - 1 = 47。
完全な報告例:
年齢を統制した後の週あたりの運動時間とうつ得点の関係を評価するために、偏相関を計算しました。運動とうつの間に統計的に有意な負の偏相関が認められました、r(47) = -.35、p = .014。運動頻度が高いほど、参加者の年齢とは独立に、うつ得点が低いことと関連していました。運動とうつのゼロ次相関は r(48) = -.41、p = .003 であり、年齢が元の関係のわずかな部分を説明していたことを示唆しています。
偏相関とゼロ次相関のどちらを報告するか
ゼロ次相関は、統制なしで計算した生の二変量相関です。交絡変数が理論的に関連する場合は、ゼロ次相関と偏相関の両方を報告してください。両方を比較することで、交絡変数を統制した後に関係がどの程度変化するかを読者に示します:
- 偏相関がゼロ次相関より実質的に小さい場合、統制変数は意味のある交絡変数でした。
- 偏相関がゼロ次相関と類似している場合、統制変数は関係にほとんど影響を与えませんでした。
- 偏相関がゼロ次相関より大きい場合(抑制効果)、統制変数が真の関係の一部を隠していました。
APA表形式の相関マトリックス
研究に複数の変数が含まれる場合、すべてのペアワイズ相関を相関マトリックスで提示することは、本文で個別に記述するよりはるかに効率的です。APA形式には、これらの表を構成するための確立された規約があります。
相関マトリックスを使用すべき場合
3つ以上の変数があり、すべてのペアワイズ関係を示したい場合に相関マトリックス表を使用します。これは、尺度、質問紙、または複数の測定構成概念を含むデータセットを扱う研究で標準的です。変数が2つだけの場合は、本文で相関を報告してください。
完全なAPA相関マトリックスの例
Table 1
主要な研究変数の平均値、標準偏差、および相互相関
| 変数 | M | SD | 1 | 2 | 3 | 4 | 5 | |------|------|------|-------|-------|-------|-------|---| | 1. 自己効力感 | 3.82 | 0.74 | — | | | | | | 2. 学業動機づけ | 4.15 | 0.68 | .52** | — | | | | | 3. 週あたりの学習時間 | 16.40 | 6.20 | .38** | .45** | — | | | | 4. テスト不安 | 2.90 | 0.85 | -.41** | -.33** | -.18 | — | | | 5. 最終GPA | 3.24 | 0.55 | .47** | .51** | .42** | -.39** | — |
注. N = 120。
* p < .05. ** p < .01. *** p < .001.
主要な書式規約
下三角のみ。 相関マトリックスは対称であるため、上三角と下三角の両方を報告するのは冗長です。対角線より下の値のみを提示し、対角線にはエムダッシュ(—)を配置します。一部の学術誌では対角線に1.00を報告することも認められていますが、ダッシュの慣習がより一般的です。
有意性アスタリスク。 一貫したアスタリスクシステムを使用します:p < .05 にアスタリスク1つ、p < .01 に2つ、任意で p < .001 に3つ。すべてのアスタリスクは表の注記で定義する必要があります。1つの原稿内でアスタリスクの慣習を混在させないでください。
記述統計量を含める。 M と SD の列を追加することで、読者が本文を探す手間が省けます。変数が異なる尺度を使用している場合は、各測定の範囲や項目数の追加も検討してください。
変数の番号付け。 行変数に番号を付け(1, 2, 3, ...)、それらの番号を列ヘッダーとして使用します。これにより表がコンパクトになり、どの相関がどのペアに対応するかが即座にわかります。
先行ゼロなし。 表内のすべての相関値はAPAの先行ゼロなしの規約に従う必要があります(例:0.52ではなく.52)。
有意な値の太字表示。 アスタリスクに加えて有意な相関を太字にすることを好む学術誌や指導教員もいます。対象となる学術誌のガイドラインを確認してください。
相関報告におけるよくある落とし穴
経験豊富な研究者でも、相関を報告する際に誤りを犯します。前述の書式上の間違いに加え、研究結果の妥当性を損なう可能性のあるいくつかの実質的な落とし穴があります。
相関と因果関係の混同
これは統計教育で最も頻繁に引用される誤りですが、出版された研究にも依然として現れます。「スクリーンタイムが読解力を低下させた」という表現は因果関係を暗示しますが、相関は因果的なつながりを確立できません。読解力が低い子どもがスクリーンにより引きつけられている可能性や、保護者の関与などの第三変数が両方を駆動している可能性があります。常に関連を示す言葉を使用してください:「〜と関連していた」「〜との関係があった」「予測した(統計的な意味で、因果的ではない)」。
非線形関係の確認不足
Pearsonの r は線形関係のみを測定します。2つの変数が強い曲線的関連——例えば覚醒とパフォーマンスの逆U字関係(ヤーキーズ・ドットソンの法則)——を持つ場合、強い関係があるにもかかわらずPearson相関はほぼゼロになる可能性があります。相関を計算する前に必ず散布図を確認してください。パターンが明らかに非線形であれば、データの変換や距離相関などの非線形関連性の測定の使用を検討してください。
rに対する外れ値の影響の無視
単一の外れ値がPearson相関を劇的に変化させる可能性があります。小さなサンプルでは、1つの逸脱したデータポイントが r をほぼゼロから.50以上へ、またはその逆に変動させることがあります。ベストプラクティスは、外れ値を含めた相関と除外した相関の両方を報告することです。1つか2つのポイントを除去して r が実質的に変化する場合は、結果セクションにこれを記載し、含意を議論してください。Spearmanの r_s は順位ベースのアプローチが外れ値の影響を最小化するため、有用な代替手段です。
補正なしに多数の相関を報告する
10個の変数からなる相関マトリックスは45個のユニークな相関を生み出します。有意水準.05では、偶然だけでも約2~3個が統計的有意性に達すると予想されます。多くの相関を同時に検討する場合は、Bonferroni補正(比較の数でアルファ水準を除算)の適用、または結果を探索的として報告することを検討してください。補正なしでは、第1種の過誤(偽陽性)のリスクが急激に増大します。
信頼区間の未報告
APA第7版は相関係数の信頼区間を強く推奨していますが、多くの研究者がこれを省略しています。信頼区間は推定の精度に関する重要な情報を提供します。95% CIが[.12, .62]の r = .40と、CIが[.35, .45]の r = .40は全く異なるストーリーを伝えます。前者はかなりの不確実性を示唆し、後者は非常に精密な推定を示します。CIの報告に関する詳細は次のセクションを参照してください。
相関の信頼区間
APA第7版は、相関係数とともに信頼区間(CI)を報告することを推奨しています。CIは相関がどの程度精密に推定されたかを伝え、有意/非有意の二項対立的な枠組みを超えて結果の実質的有意性を評価するのに役立ちます。
信頼区間付き相関のAPA形式
推奨される形式は、CIを報告に直接統合します:
r(df) = .XX、95% CI [.XX, .XX]、p = .XXX
完全な報告例:
マインドフルネス実践の頻度と知覚ストレスの関係を評価するために、Pearson相関を計算しました。統計的に有意な負の相関が認められました、r(48) = -.42、95% CI [-.63, -.16]、p = .003。マインドフルネス実践の頻度が高いほど、知覚ストレスレベルが低いことと関連していました。
信頼区間の計算方法:Fisherのz変換
相関係数は-1と+1の間に制限されており、その標本分布は歪んでいます(特にゼロから遠い値の場合)。信頼区間を構成するために、相関はまずFisherのz変換を使用して変換され、標本分布を正規化します:
z = 0.5 × ln[(1 + r) / (1 - r)]
z の標準誤差は 1 / sqrt(N - 3) です。z スケールでCIを計算した後、端点を r スケールに逆変換します。この手順は、真の相関がゼロから遠い場合でも正確なCIを生成します。
この変換を手作業で行う必要はありません——ほとんどの統計ソフトウェアとオンライン計算機(StatMateを含む)が自動的に処理します。
広いCIと狭いCIの解釈
狭いCI(例:r = .45、95% CI [.38, .51])は精密な推定を示し、通常は大きなサンプルサイズから得られます。読者は、真の母集団相関がこの狭い範囲内にあることをかなり確信できます。
広いCI(例:r = .45、95% CI [.10, .70])はかなりの不確実性を示します。点推定値は中程度の相関を示唆していますが、真の値は小さいものから大きいものまでどこにでも存在し得ます。広いCIは通常、小さなサンプルサイズから生じ、結果を慎重に解釈し、より大きなサンプルで再現する必要があることを示唆しています。
一般的なガイドラインとして、CI幅はサンプルサイズが増加するにつれて減少します。N = 30に基づく相関は、N = 200に基づく同じ相関よりもはるかに広いCIを持ちます。
信頼区間がp値よりも重要な理由
p 値は、相関がゼロと統計的に区別可能かどうかだけを示します。CIは母集団相関の可能な範囲を示します。2つの研究がともに p < .05 で r = .30 を見出したとしても、一方のCIが[.05, .52]で他方が[.22, .37]であれば、2番目の研究が意味のある効果に関してはるかに強い証拠を提供しています。これが、APA第7版がCIを有意性検定のより有益な補完として強調する理由です。
よくある質問
Pearson相関とSpearman相関の違いは何ですか?
Pearsonの r は、2つの連続的で正規分布に従う変数間の線形関係の強さを測定します。間隔尺度または比率尺度の測定を仮定し、外れ値に敏感です。Spearmanの r_s はデータを順位に変換し、単調な関係の強さを測定します。順序データ、非正規分布、または外れ値が存在する場合に適しています。両方の係数は-1から+1の範囲を持ち、解釈には同じCohenベンチマークを使用します。パラメトリックな仮定が満たされる場合はPearsonを、そうでない場合はSpearmanを選択してください。
相関が正確にゼロになることはありますか?
理論的には、r = 0 は線形関係が全くないことを示します。実際には、ランダムな標本変動のため、標本相関がちょうどゼロになることはほとんどありません。母集団で2つの変数が完全に無関係であっても、標本は通常、小さな非ゼロの相関(例:r = .03 または r = -.05)を生じます。このような値は、非有意な p 値と組み合わされた場合、意味のある関係がないと解釈されます。
有意でない相関はどのように報告しますか?
有意な結果と全く同じ形式を使用します。結果を述べ、統計量を報告し、簡潔な解釈を提供してください:
1日の水分摂取量と試験得点の間に統計的に有意な相関は認められませんでした、r(48) = .12、p = .410。
有意性にかかわらず、常に効果量を含めてください。有意でない相関を結果セクションや相関マトリックスから省略しないでください。
相関分析にはどの程度のサンプルサイズが必要ですか?
必要なサンプルサイズは、予想される効果量と希望する統計的検出力に依存します。アルファ = .05、検出力 = .80 の標準的な慣習を使用する場合:大きい相関(r = .50)を検出するには約29名、中程度の相関(r = .30)には約85名、小さい相関(r = .10)には約782名が必要です。これらの数値は、小さな効果の検出に実質的により大きなサンプルが必要な理由を示しています。StatMateのサンプルサイズ計算機などのツールを使用して、データ収集前に必ず検出力分析を実施してください。
カテゴリカル変数を相関分析できますか?
PearsonとSpearmanの相関は、少なくとも順序データを必要とします。2つの名義(順序なしのカテゴリカル)変数には、カイ二乗検定から得られるCramérの V またはファイ係数を使用します。1つの二値変数と1つの連続変数には、点双列相関(r_pb)を使用します。これは、一方の変数がちょうど2つのカテゴリを持つ場合、Pearsonの r と数学的に同等です。1つの順序変数と1つの連続変数には、Spearmanの r_s が適切です。
r²はrが教えてくれないことの何を教えてくれますか?
決定係数(r²)は、2つの変数間の共有分散の割合を表します。r = .50 は中程度の関係のように聞こえますが、それを二乗すると r² = .25 となり、一方の変数の分散の25%しか他方で説明されていないことがわかります。これは実質的有意性のより直感的な測定を提供します。例えば、r = .30 は r² = .09 に相当し、わずか9%の共有分散を示します——これが研究の文脈によって実質的に意味があるかどうかは異なります。
相関では片側検定と両側検定のどちらを使うべきですか?
データ収集前に関係の特定の方向を予測する強い理論的または実証的根拠がない限り、両側検定をデフォルトとして使用してください。片側検定は予測された方向の効果を検出する統計的検出力を高めますが、逆方向の効果は完全に見逃します。ほとんどの学術誌は両側検定を期待しており、方向性の仮説が序論で十分に正当化されていない限り、査読者は片側検定に疑問を呈するかもしれません。
相関分析で外れ値をどう扱いますか?
まず散布図を確認して、潜在的な外れ値を視覚的に特定します。外れ値が存在する場合は、多段階のアプローチに従ってください。第一に、外れ値がデータ入力エラーでないことを確認します。第二に、外れ値を含めた相関と除外した相関の両方を計算します。外れ値を除去して r が実質的に変化する場合は、両方の値を報告し、含意を議論します。第三に、生の値ではなく順位に基づいて動作するため外れ値にはるかに影響されにくいSpearmanの相関の使用を検討します。正当な根拠と透明な報告なしに外れ値を黙って除去することは決してしないでください。
StatMateの無料相関計算機をお試しください
相関の結果を手作業でフォーマットするのは、面倒でエラーが起きやすい作業です。StatMateの相関計算機は、全プロセスを自動化します。
2つの変数を入力すると、StatMateが瞬時に以下を計算します:
- 正確な p 値付きのPearsonの r
- 決定係数(r²)
- r の95%信頼区間
- 回帰直線付きの散布図
- 原稿にコピーできるAPA形式の結果
出力はこのガイドで取り上げたすべてのAPA第7版の規約に従います:正しい小数桁数、先行ゼロなし、自由度、平易な言葉での解釈。フォーマットされたテキストを直接コピーするか、ワンクリックでWord(.docx)にエクスポートできます。