「原油価格が上がると、食料価格も上がる」
「インフレとエネルギー価格には強い相関がある」
こうした言い回しを、ニュースやSNSでよく目にする。
確かに、データを取って相関係数を計算すると、
それらしく高い数値が出ることもある。
だが──
相関がある、という事実だけで
「関係がある」「原因だ」と考えてしまってよいのだろうか。
この記事では、
相関とは何かを整理したうえで、
なぜ価格データや経済データでは相関が誤解されやすいのかを考えていく。
相関とは何を表しているのか
相関とは、
**二つの変数が「一緒に動く傾向があるかどうか」**を表す指標だ。
-
一方が上がると、もう一方も上がる → 正の相関
-
一方が上がると、もう一方は下がる → 負の相関
-
動きに一貫性がない → 相関が弱い/ない
ここで重要なのは、
相関は「同時にどう動いたか」しか見ていないという点だ。
つまり、相関が高くても、そこで分かるのは
「この2つは、同じ方向に動いていた“ことが多い”」
という事実だけだ。
例1:正の相関(“一緒に上がる”)——原油価格と輸送コスト
たとえば、原油価格(Brentなど)が上がると、
燃料費が上がり、海上運賃や陸送コストが上がりやすい。
このとき
-
原油価格(上がる)
-
輸送コスト(上がる)
という動きになり、正の相関が出やすい。
ただし、ここで注意したいのは、
相関係数は「理由」を見ているわけではないということだ。
原油が上がったから輸送コストが上がった、という因果は“ありそう”だが、
相関係数そのものは
-
たまたま同時期に上がったのか
-
本当に燃料費が原因なのか(供給逼迫、港湾混雑、規制などは?)
-
どれくらい遅れて効いているのか(翌月?翌々月?)
といった点を教えてくれない。
相関はあくまで
「一緒に動いた」ことを知らせる信号でしかない。
例2:負の相関(“片方が上がると片方が下がる”)——金利と住宅購入(イメージ)
負の相関の例として分かりやすいのは、金利と住宅購入だ。
金利が上がるとローンの負担が増えるので、
住宅購入が減りやすい。
-
金利(上がる)
-
住宅購入(下がる)
このように逆向きに動くことが多いと、負の相関が出る。
ここでも同じで、相関係数は
-
なぜ住宅購入が減ったのか(金利以外に景気悪化や雇用不安は?)
-
どのくらい遅れて効くのか(政策金利→住宅ローン金利→購買行動)
-
地域や制度で違いがないか
を教えてくれるわけではない。
つまり、相関は「関係の形」を示すが、
「関係の仕組み」までは示さない。
例3:相関が弱い(“一緒に動かない”)——原油価格とコメ価格(短期)
ここが一番誤解が起きるところ。
「原油が上がると食料も上がる」と言われることは多い。
しかし、短期(たとえば数か月〜1年程度)で見ると、
-
原油は大きく上下しているのに
-
コメ価格はあまり動かない
という期間が普通にある。
この場合、相関は弱く出ることがある。
なぜか。
-
コメは政策・在庫・貿易規制の影響が大きい
-
そもそも価格形成が“先物中心”の穀物と違う
-
コスト上昇が価格に転嫁されるまで時間がかかる(ラグ)
つまり、相関が弱いからといって
「原油とコメは関係ない」
と断言できない。
関係があっても、
**時間差(ラグ)**があるだけで、
“同時”には動かないことがあるからだ。
「同時にどう動いたか」しか見ていない、とはどういうことか
相関が見ているのは、たとえばこんなものだ。
-
ある月に原油が上がった
-
同じ月に食料価格も上がった
→ 一緒に動いた(加点)
これをたくさん積み上げて、
「一緒に動くことが多いか?」を数値にしている。
でも現実には、
-
原油が上がった 数か月後に 肥料が上がり
-
肥料が上がった さらに後に 穀物コストが効いてくる
というように、因果があったとしても
“同じ月”には動かないことがある。
だから、
-
相関が高い → たまたま同時期に動いていた可能性もある
-
相関が低い → 時間差があるだけの可能性もある
どちらもあり得る。
だから相関から言えるのは「次に何を確かめるべきか」だけ
相関を見て
-
相関が高い → 「なぜ同時に動いた?」を疑う
-
相関が低い → 「時間差がある?別の要因?」を疑う
この“疑う方向”が分かるのが相関の価値だ。
相関は結論ではなく、
問いの方向を指し示す矢印だと思うと誤解しにくい。
相関係数はどのように計算されるか
一般的に使われるのは、**相関係数(ピアソンの相関係数)**だ。
数式そのものは、ぱっと見ると難しそうに見える。
だが、やっていることは実はとても単純だ。
-
それぞれのデータを「平均との差」に直す
-
そのズレが、同じ方向か、逆方向かを見る
という操作をしている。
相関係数の数式(軽く見るだけでOK)
ピアソンの相関係数
は、次の式で定義される。
ここで、
-
,
:それぞれのデータ
-
,
:平均値
を表している。
数式を理解しようとしなくても構わない。
見るべきポイントは分子と分母の意味だ。
この式がやっていること
① 平均からのズレを見る
まず、各データから平均を引くことで、
「いつもより高いか、低いか」
だけを取り出している。
価格水準そのものではなく、
動きの方向と大きさに注目している。
② ズレの向きが揃っているかを見る
-
両方とも平均より上 → 正
-
片方が上、片方が下 → 負
分子では、
この「ズレの向き」がどれだけ揃っているかを足し合わせている。
③ 大きさをそろえて比較する
分母では、ズレの大きさで割ることで、
-
単位の違い(ドル、円、指数など)
-
変動の大きさの違い
を打ち消している。
これによって、
異なる尺度のデータ同士でも比較できるようになる。
相関係数の値はどう解釈されるか
相関係数は必ず -1 から +1 の範囲に収まる。
-
+1 に近い
→ ほぼ同じ方向に動いている -
0 に近い
→ 一貫した動きが見えない -
-1 に近い
→ 逆方向に動いている
ここで重要なのは、
この数値が示しているのは 「一緒に動き方」だけ という点だ。
数値が高くても「強い関係がある」とは限らない(具体例)
相関係数が 0.8 や 0.9 と聞くと、
「かなり強い関係がある」と感じてしまう。
だが、その数値が示しているのは、
**あくまで「同じ方向に動いていた時期が多かった」**という事実だけだ。
そこには、いくつもの誤解が入り込む余地がある。
例1:同じ時期に動いていただけのケース(原油価格と物価指数)
たとえば、原油価格と消費者物価指数(CPI)を、
ある数年間で並べてみると、高い相関が出ることがある。
原油が上がった時期に、
CPIも上昇しているからだ。
しかし、ここで考えるべきなのは、
-
本当に原油が原因だったのか
-
同時期に金融緩和や需要回復はなかったか
-
他のコスト(人件費・物流・為替)はどうだったか
という点だ。
原油とCPIが「同時に上がった」ことと、
原油が「インフレの主因だった」ことは、同じではない。
相関係数は、この違いを区別してくれない。
例2:トレンドが似ていただけのケース(長期データの落とし穴)
長期の価格データは、多くの場合、右肩上がりになる。
たとえば、
-
世界の食料価格指数
-
世界のエネルギー価格指数
を10年、20年というスパンで見ると、
どちらも長期的には上昇トレンドを持つ。
この2つで相関係数を計算すると、
かなり高い数値が出ることがある。
だがそれは、
「どちらも長期的に上がっていただけ」
という可能性を強く含んでいる。
トレンドを取り除いたり、期間を短く区切ったりすると、
相関が一気に弱くなることも珍しくない。
**トレンドが似ているだけで、
“関係があるように見えてしまう”**のが相関の怖さだ。
例3:第三の要因に引っ張られているケース(為替・金融環境)
もう一つよくあるのが、第三の要因の存在だ。
たとえば、
-
コモディティ価格
-
株価
この2つは、ある時期に高い相関を示すことがある。
だが、その背景には、
-
ドル安
-
金融緩和
-
グローバルなリスク選好
といった、共通の要因がある場合が多い。
この場合、
-
コモディティが上がったから株が上がった
-
株が上がったからコモディティが上がった
とは限らない。
両方が「同じ空気」に引っ張られて、
同じ方向に動いていただけかもしれない。
相関係数は、この「空気」の存在を教えてくれない。
相関係数が語らないもの
相関係数は、次の問いには一切答えない。
-
なぜ一緒に動いたのか
-
どちらが先に動いたのか
-
時間差はあるのか
-
別の要因を入れると崩れないか
それでも、数値が高いと
「分かった気」になってしまう。
ここが一番危ない。
相関の正しい使いどころ
だから、このブログでは相関をこう扱う。
相関係数が高い
→ すぐ結論を出すのではなく、
「どこが怪しいか」を疑う
-
同時性の罠か
-
トレンドの影響か
-
第三の要因か
相関は「証拠」ではない。
次に考えるべきポイントを指し示すメモのようなものだ。
補足(読み飛ばしてOK)
数式が気になる人は、
Excel や Python で相関係数を計算してみるとよい。
一方で、
数式を理解しなくても、
相関の落とし穴は理解できる。
それが、このブログで一番伝えたいことだ。
なぜ経済やコモディティでは相関が誤解されやすいのか
理由は単純で、経済やコモディティのデータには、
相関が「それっぽく」見えてしまう条件が最初から揃っている。
① データが連続している(今日の値は昨日の影響を受ける)
価格データは、基本的に“連続した時間の流れ”の中にある。
-
今日の原油価格は、昨日の原油価格から大きく飛びにくい
-
今月の物価は、先月の物価の延長として動くことが多い
つまり、各データ点が独立ではなく、
過去の値が現在の値に残り続ける性質を持つ。
この性質があると、
「なんとなく似た動き」に見えやすくなる。
② トレンドを持ちやすい(右肩上がり/右肩下がり)
経済指標や価格指数は、長期で見るとトレンドを持つことが多い。
-
物価は長期的に上がりやすい
-
エネルギーも長期で上がる局面がある
-
食料価格も同様に上昇する期間がある
このとき、二つの系列が
-
どちらも長期で上がっている
-
どちらも長期で下がっている
というだけで、相関が高く出てしまうことがある。
つまり、
「関係があるから似ている」
ではなく、
「上がりやすい性質が似ているから関係があるように見える」
というパターンが起きる。
③ 多くの要因が同時に動く(“同じ空気”に引っ張られる)
経済は、単一の原因で動くことが少ない。
同じ時期に、同時に動く要因がいくつもある。
-
金利
-
為替(ドル高/ドル安)
-
供給制約
-
地政学リスク
-
需要の回復
-
金融緩和・引き締め
こうした要因が“同じ方向”に働くと、
複数の指標が一緒に動きやすい。
その結果、
-
原油も上がる
-
食料も上がる
-
物価も上がる
という状況が生まれ、相関が高く見える。
だが、それは「原因が一つだから」ではなく、
同じ環境に引っ張られて同時に動いているだけかもしれない。
「原油が上がったからインフレになった」と言いたくなる理由
原油価格とインフレ率。
食料価格とCPI。
確かに、関係はありそうに見える。
そして、人は「分かりやすい説明」を求める。
原油が上がった
→ 物価が上がった
→ だから原油が原因だ
こう言えれば、理解した気になれる。
だが、この瞬間に、思考は止まる。
-
原油以外の要因を見なくなる
-
時間差(ラグ)を考えなくなる
-
“たまたま同じ時期だった”可能性を捨ててしまう
相関を因果の証拠として扱うと、
現実を単純化しすぎて、判断を誤りやすくなる。
相関は「答え」ではなく「問い」を与える
相関を見る意味がないわけではない。
むしろ、相関はとても重要だ。
ただし、相関の役割はこうだ。
相関は、結論を出すための道具ではなく、
次に何を考えるべきかを教えてくれるサイン
相関が高かったとき、本当にやるべきことは
「関係がある」と決めることではない。
むしろ、ここから問いが始まる。
相関が高いときに立てるべき問い
1)なぜ一緒に動いたのか?
第三の要因(為替、金利、金融環境)が両方を動かしていないか。
2)本当に同時に動いているのか?
同じ月に動いているように見えて、実は観測頻度の問題(週次・月次)でずれていないか。
3)時間差(ラグ)はないのか?
原油 → 肥料 → 食料のように、因果があっても“遅れて効く”ケースは多い。
4)期間を変えても成り立つのか?
直近だけ/長期だけで成立していないか。危機の期間だけで強く見えていないか。
5)トレンドを除いても残るのか?
長期の上昇トレンドが相関を作っていないか。
このブログで相関を使う目的
相関は、判断を代行してくれる「答え」ではない。
だが、考える順番を与えてくれる。
-
まず相関を見る
-
次に「何が怪しいか」を疑う
-
それから時系列(ラグ・トレンド)に進む
この順番で進めると、
数字に振り回されにくくなる。
次に読むべき内容
相関を正しく理解すると、
次に必ずぶつかる疑問がある。
「一緒に動いていないように見えるのに、
本当に関係はないのだろうか?」
この疑問に答えるために必要なのが、
時間の流れをどう扱うかという視点だ。
価格データや経済データでは、
因果があったとしても、
同じタイミングで動くとは限らない。
この点を理解しないと、
相関は簡単に誤解されてしまう。
▶ 時系列データとは何か?価格データを見るときの基本的な考え方
(※時間差・トレンド・ラグの考え方を整理)
また、
相関や時系列の考え方を使って、
実際のデータをどのように読むのかについては、
以下の記事で具体例を扱っている。
▶ 世界的インフレはなぜ起きたのか?原油・食料・金融から構造的に読み解く
(※エネルギーと食料価格を例に、構造的な読み方を解説)
まとめ
-
相関は、二つのデータが一緒に動いたかどうかを示す指標にすぎない
-
相関が高くても、どちらが原因か、なぜそうなったかは分からない
-
価格や経済データでは、トレンドや同時要因による疑似相関が起きやすい
-
相関は「判断」や「結論」を出すための道具ではなく、
次に何を考えるべきかを示すきっかけとして使うべきもの
数字を見る力とは、
単に数字を計算できることではない。
数字をどこまで信じ、
どこから疑うべきかを考える力だ。
このブログでは、
そうした視点を、
これからもデータと一緒に扱っていく。
コメント