相関とは何か?意味・計算方法・注意点をわかりやすく解説

数学基礎

「原油価格が上がると、食料価格も上がる」
「インフレとエネルギー価格には強い相関がある」

こうした言い回しを、ニュースやSNSでよく目にする。

確かに、データを取って相関係数を計算すると、
それらしく高い数値が出ることもある。

だが──
相関がある、という事実だけで
「関係がある」「原因だ」と考えてしまってよいのだろうか。

この記事では、
相関とは何かを整理したうえで、
なぜ価格データや経済データでは相関が誤解されやすいのかを考えていく。

  1. 相関とは何を表しているのか
    1. 例1:正の相関(“一緒に上がる”)——原油価格と輸送コスト
    2. 例2:負の相関(“片方が上がると片方が下がる”)——金利と住宅購入(イメージ)
    3. 例3:相関が弱い(“一緒に動かない”)——原油価格とコメ価格(短期)
    4. 「同時にどう動いたか」しか見ていない、とはどういうことか
    5. だから相関から言えるのは「次に何を確かめるべきか」だけ
  2. 相関係数はどのように計算されるか
    1. 相関係数の数式(軽く見るだけでOK)
    2. この式がやっていること
      1. ① 平均からのズレを見る
      2. ② ズレの向きが揃っているかを見る
      3. ③ 大きさをそろえて比較する
    3. 相関係数の値はどう解釈されるか
  3. 数値が高くても「強い関係がある」とは限らない(具体例)
    1. 例1:同じ時期に動いていただけのケース(原油価格と物価指数)
    2. 例2:トレンドが似ていただけのケース(長期データの落とし穴)
    3. 例3:第三の要因に引っ張られているケース(為替・金融環境)
    4. 相関係数が語らないもの
    5. 相関の正しい使いどころ
    6. 補足(読み飛ばしてOK)
  4. なぜ経済やコモディティでは相関が誤解されやすいのか
    1. ① データが連続している(今日の値は昨日の影響を受ける)
    2. ② トレンドを持ちやすい(右肩上がり/右肩下がり)
    3. ③ 多くの要因が同時に動く(“同じ空気”に引っ張られる)
  5. 「原油が上がったからインフレになった」と言いたくなる理由
    1. 相関は「答え」ではなく「問い」を与える
    2. 相関が高いときに立てるべき問い
    3. このブログで相関を使う目的
  6. 次に読むべき内容
  7. まとめ
    1. 関連記事:

相関とは何を表しているのか

相関とは、
**二つの変数が「一緒に動く傾向があるかどうか」**を表す指標だ。

  • 一方が上がると、もう一方も上がる → 正の相関

  • 一方が上がると、もう一方は下がる → 負の相関

  • 動きに一貫性がない → 相関が弱い/ない

ここで重要なのは、
相関は「同時にどう動いたか」しか見ていないという点だ。

つまり、相関が高くても、そこで分かるのは

「この2つは、同じ方向に動いていた“ことが多い”」

という事実だけだ。


例1:正の相関(“一緒に上がる”)——原油価格と輸送コスト

たとえば、原油価格(Brentなど)が上がると、
燃料費が上がり、海上運賃や陸送コストが上がりやすい。

このとき

  • 原油価格(上がる)

  • 輸送コスト(上がる)

という動きになり、正の相関が出やすい。

ただし、ここで注意したいのは、
相関係数は「理由」を見ているわけではないということだ。

原油が上がったから輸送コストが上がった、という因果は“ありそう”だが、
相関係数そのものは

  • たまたま同時期に上がったのか

  • 本当に燃料費が原因なのか(供給逼迫、港湾混雑、規制などは?)

  • どれくらい遅れて効いているのか(翌月?翌々月?)

といった点を教えてくれない。

相関はあくまで
「一緒に動いた」ことを知らせる信号でしかない。


例2:負の相関(“片方が上がると片方が下がる”)——金利と住宅購入(イメージ)

負の相関の例として分かりやすいのは、金利と住宅購入だ。

金利が上がるとローンの負担が増えるので、
住宅購入が減りやすい。

  • 金利(上がる)

  • 住宅購入(下がる)

このように逆向きに動くことが多いと、負の相関が出る。

ここでも同じで、相関係数は

  • なぜ住宅購入が減ったのか(金利以外に景気悪化や雇用不安は?)

  • どのくらい遅れて効くのか(政策金利→住宅ローン金利→購買行動)

  • 地域や制度で違いがないか

を教えてくれるわけではない。

つまり、相関は「関係の形」を示すが、
「関係の仕組み」までは示さない。


例3:相関が弱い(“一緒に動かない”)——原油価格とコメ価格(短期)

ここが一番誤解が起きるところ。

「原油が上がると食料も上がる」と言われることは多い。
しかし、短期(たとえば数か月〜1年程度)で見ると、

  • 原油は大きく上下しているのに

  • コメ価格はあまり動かない

という期間が普通にある。

この場合、相関は弱く出ることがある。

なぜか。

  • コメは政策・在庫・貿易規制の影響が大きい

  • そもそも価格形成が“先物中心”の穀物と違う

  • コスト上昇が価格に転嫁されるまで時間がかかる(ラグ)

つまり、相関が弱いからといって

「原油とコメは関係ない」

と断言できない。

関係があっても、
**時間差(ラグ)**があるだけで、
“同時”には動かないことがあるからだ。


「同時にどう動いたか」しか見ていない、とはどういうことか

相関が見ているのは、たとえばこんなものだ。

  • ある月に原油が上がった

  • 同じ月に食料価格も上がった
    → 一緒に動いた(加点)

これをたくさん積み上げて、
「一緒に動くことが多いか?」を数値にしている。

でも現実には、

  • 原油が上がった 数か月後に 肥料が上がり

  • 肥料が上がった さらに後に 穀物コストが効いてくる

というように、因果があったとしても
“同じ月”には動かないことがある。

だから、

  • 相関が高い → たまたま同時期に動いていた可能性もある

  • 相関が低い → 時間差があるだけの可能性もある

どちらもあり得る。


だから相関から言えるのは「次に何を確かめるべきか」だけ

相関を見て

  • 相関が高い → 「なぜ同時に動いた?」を疑う

  • 相関が低い → 「時間差がある?別の要因?」を疑う

この“疑う方向”が分かるのが相関の価値だ。

相関は結論ではなく、
問いの方向を指し示す矢印だと思うと誤解しにくい。


相関係数はどのように計算されるか

一般的に使われるのは、**相関係数(ピアソンの相関係数)**だ。

数式そのものは、ぱっと見ると難しそうに見える。
だが、やっていることは実はとても単純だ。

  • それぞれのデータを「平均との差」に直す

  • そのズレが、同じ方向か、逆方向かを見る

という操作をしている。


相関係数の数式(軽く見るだけでOK)

ピアソンの相関係数

rr

は、次の式で定義される。

r=i=1n(xixˉ)(yiyˉ)i=1n(xixˉ)2i=1n(yiyˉ)2r = \frac{ \sum_{i=1}^{n} (x_i – \bar{x})(y_i – \bar{y}) }{ \sqrt{\sum_{i=1}^{n} (x_i – \bar{x})^2} \sqrt{\sum_{i=1}^{n} (y_i – \bar{y})^2} }

 

ここで、

  • xix_i,

    yiy_i:それぞれのデータ

  • xˉ\bar{x},

    yˉ\bar{y}:平均値

を表している。

数式を理解しようとしなくても構わない。
見るべきポイントは分子と分母の意味だ。


この式がやっていること

① 平均からのズレを見る

まず、各データから平均を引くことで、

「いつもより高いか、低いか」

だけを取り出している。

価格水準そのものではなく、
動きの方向と大きさに注目している。


② ズレの向きが揃っているかを見る

  • 両方とも平均より上 → 正

  • 片方が上、片方が下 → 負

分子では、
この「ズレの向き」がどれだけ揃っているかを足し合わせている。


③ 大きさをそろえて比較する

分母では、ズレの大きさで割ることで、

  • 単位の違い(ドル、円、指数など)

  • 変動の大きさの違い

を打ち消している。

これによって、
異なる尺度のデータ同士でも比較できるようになる。


相関係数の値はどう解釈されるか

相関係数は必ず -1 から +1 の範囲に収まる。

  • +1 に近い
    → ほぼ同じ方向に動いている

  • 0 に近い
    → 一貫した動きが見えない

  • -1 に近い
    → 逆方向に動いている

ここで重要なのは、
この数値が示しているのは 「一緒に動き方」だけ という点だ。


数値が高くても「強い関係がある」とは限らない(具体例)

相関係数が 0.8 や 0.9 と聞くと、
「かなり強い関係がある」と感じてしまう。

だが、その数値が示しているのは、
**あくまで「同じ方向に動いていた時期が多かった」**という事実だけだ。

そこには、いくつもの誤解が入り込む余地がある。


例1:同じ時期に動いていただけのケース(原油価格と物価指数)

たとえば、原油価格と消費者物価指数(CPI)を、
ある数年間で並べてみると、高い相関が出ることがある。

原油が上がった時期に、
CPIも上昇しているからだ。

しかし、ここで考えるべきなのは、

  • 本当に原油が原因だったのか

  • 同時期に金融緩和や需要回復はなかったか

  • 他のコスト(人件費・物流・為替)はどうだったか

という点だ。

原油とCPIが「同時に上がった」ことと、
原油が「インフレの主因だった」ことは、同じではない。

相関係数は、この違いを区別してくれない。


例2:トレンドが似ていただけのケース(長期データの落とし穴)

長期の価格データは、多くの場合、右肩上がりになる。

たとえば、

  • 世界の食料価格指数

  • 世界のエネルギー価格指数

を10年、20年というスパンで見ると、
どちらも長期的には上昇トレンドを持つ。

この2つで相関係数を計算すると、
かなり高い数値が出ることがある。

だがそれは、

「どちらも長期的に上がっていただけ」

という可能性を強く含んでいる。

トレンドを取り除いたり、期間を短く区切ったりすると、
相関が一気に弱くなることも珍しくない。

**トレンドが似ているだけで、
“関係があるように見えてしまう”**のが相関の怖さだ。


例3:第三の要因に引っ張られているケース(為替・金融環境)

もう一つよくあるのが、第三の要因の存在だ。

たとえば、

  • コモディティ価格

  • 株価

この2つは、ある時期に高い相関を示すことがある。

だが、その背景には、

  • ドル安

  • 金融緩和

  • グローバルなリスク選好

といった、共通の要因がある場合が多い。

この場合、

  • コモディティが上がったから株が上がった

  • 株が上がったからコモディティが上がった

とは限らない。

両方が「同じ空気」に引っ張られて、
同じ方向に動いていただけかもしれない。

相関係数は、この「空気」の存在を教えてくれない。


相関係数が語らないもの

相関係数は、次の問いには一切答えない。

  • なぜ一緒に動いたのか

  • どちらが先に動いたのか

  • 時間差はあるのか

  • 別の要因を入れると崩れないか

それでも、数値が高いと
「分かった気」になってしまう。

ここが一番危ない。


相関の正しい使いどころ

だから、このブログでは相関をこう扱う。

相関係数が高い
→ すぐ結論を出すのではなく、
「どこが怪しいか」を疑う

  • 同時性の罠か

  • トレンドの影響か

  • 第三の要因か

相関は「証拠」ではない。
次に考えるべきポイントを指し示すメモのようなものだ。


補足(読み飛ばしてOK)

数式が気になる人は、
Excel や Python で相関係数を計算してみるとよい。

一方で、
数式を理解しなくても、
相関の落とし穴は理解できる

それが、このブログで一番伝えたいことだ。


なぜ経済やコモディティでは相関が誤解されやすいのか

理由は単純で、経済やコモディティのデータには、
相関が「それっぽく」見えてしまう条件が最初から揃っている

① データが連続している(今日の値は昨日の影響を受ける)

価格データは、基本的に“連続した時間の流れ”の中にある。

  • 今日の原油価格は、昨日の原油価格から大きく飛びにくい

  • 今月の物価は、先月の物価の延長として動くことが多い

つまり、各データ点が独立ではなく、
過去の値が現在の値に残り続ける性質を持つ。

この性質があると、
「なんとなく似た動き」に見えやすくなる。


② トレンドを持ちやすい(右肩上がり/右肩下がり)

経済指標や価格指数は、長期で見るとトレンドを持つことが多い。

  • 物価は長期的に上がりやすい

  • エネルギーも長期で上がる局面がある

  • 食料価格も同様に上昇する期間がある

このとき、二つの系列が

  • どちらも長期で上がっている

  • どちらも長期で下がっている

というだけで、相関が高く出てしまうことがある。

つまり、

「関係があるから似ている」
ではなく、
「上がりやすい性質が似ているから関係があるように見える」

というパターンが起きる。


③ 多くの要因が同時に動く(“同じ空気”に引っ張られる)

経済は、単一の原因で動くことが少ない。

同じ時期に、同時に動く要因がいくつもある。

  • 金利

  • 為替(ドル高/ドル安)

  • 供給制約

  • 地政学リスク

  • 需要の回復

  • 金融緩和・引き締め

こうした要因が“同じ方向”に働くと、
複数の指標が一緒に動きやすい。

その結果、

  • 原油も上がる

  • 食料も上がる

  • 物価も上がる

という状況が生まれ、相関が高く見える。

だが、それは「原因が一つだから」ではなく、
同じ環境に引っ張られて同時に動いているだけかもしれない。


「原油が上がったからインフレになった」と言いたくなる理由

原油価格とインフレ率。
食料価格とCPI。

確かに、関係はありそうに見える。

そして、人は「分かりやすい説明」を求める。

原油が上がった
→ 物価が上がった
→ だから原油が原因だ

こう言えれば、理解した気になれる。

だが、この瞬間に、思考は止まる。

  • 原油以外の要因を見なくなる

  • 時間差(ラグ)を考えなくなる

  • “たまたま同じ時期だった”可能性を捨ててしまう

相関を因果の証拠として扱うと、
現実を単純化しすぎて、判断を誤りやすくなる。


相関は「答え」ではなく「問い」を与える

相関を見る意味がないわけではない。
むしろ、相関はとても重要だ。

ただし、相関の役割はこうだ。

相関は、結論を出すための道具ではなく、
次に何を考えるべきかを教えてくれるサイン

相関が高かったとき、本当にやるべきことは
「関係がある」と決めることではない。

むしろ、ここから問いが始まる。


相関が高いときに立てるべき問い

1)なぜ一緒に動いたのか?
第三の要因(為替、金利、金融環境)が両方を動かしていないか。

2)本当に同時に動いているのか?
同じ月に動いているように見えて、実は観測頻度の問題(週次・月次)でずれていないか。

3)時間差(ラグ)はないのか?
原油 → 肥料 → 食料のように、因果があっても“遅れて効く”ケースは多い。

4)期間を変えても成り立つのか?
直近だけ/長期だけで成立していないか。危機の期間だけで強く見えていないか。

5)トレンドを除いても残るのか?
長期の上昇トレンドが相関を作っていないか。


このブログで相関を使う目的

相関は、判断を代行してくれる「答え」ではない。
だが、考える順番を与えてくれる。

  • まず相関を見る

  • 次に「何が怪しいか」を疑う

  • それから時系列(ラグ・トレンド)に進む

この順番で進めると、
数字に振り回されにくくなる。


次に読むべき内容

相関を正しく理解すると、
次に必ずぶつかる疑問がある。

「一緒に動いていないように見えるのに、
本当に関係はないのだろうか?」

この疑問に答えるために必要なのが、
時間の流れをどう扱うかという視点だ。

価格データや経済データでは、
因果があったとしても、
同じタイミングで動くとは限らない

この点を理解しないと、
相関は簡単に誤解されてしまう。

時系列データとは何か?価格データを見るときの基本的な考え方
(※時間差・トレンド・ラグの考え方を整理)

また、
相関や時系列の考え方を使って、
実際のデータをどのように読むのかについては、
以下の記事で具体例を扱っている。

世界的インフレはなぜ起きたのか?原油・食料・金融から構造的に読み解く
(※エネルギーと食料価格を例に、構造的な読み方を解説)


まとめ

  • 相関は、二つのデータが一緒に動いたかどうかを示す指標にすぎない

  • 相関が高くても、どちらが原因か、なぜそうなったかは分からない

  • 価格や経済データでは、トレンドや同時要因による疑似相関が起きやすい

  • 相関は「判断」や「結論」を出すための道具ではなく、
    次に何を考えるべきかを示すきっかけとして使うべきもの

数字を見る力とは、
単に数字を計算できることではない。

数字をどこまで信じ、
どこから疑うべきかを考える力
だ。

このブログでは、
そうした視点を、
これからもデータと一緒に扱っていく。

コメント

タイトルとURLをコピーしました