中央値(Median)とは?平均では見えない“本当の真ん中”を知ろう

数学
Sponsored Link

🧭 はじめに:なぜ中央値が重要なのか?

「平均値(mean)」は便利ですが、実は外れ値にとても弱い指標です。
極端な数値が1つあるだけで、全体の印象が大きく歪んでしまいます。

一方で、「中央値(median)」はデータの真ん中の値を表し、外れ値に影響されにくいのが特徴です。
統計や実務分析では、中央値が現実をより的確に表す場面がたくさんあります。


👦 直感的なたとえ:「身長で並ぶ」とわかりやすい!

たとえば、クラス全員を身長順に1列に並べたとしましょう。

このとき、**ちょうど真ん中にいる人の身長が“中央値”**です。
片方にはそれより低い人、もう片方にはそれより高い人が並んでいます。


🧮 数学的な定義(奇数と偶数で異なる)

中央値の計算方法は、データ数

nn

奇数か偶数かで変わります。

🔹 奇数の場合

昇順に並べたときの中央の値が中央値:

Median=xn+12\text{Median} = x_{\frac{n+1}{2}}

 

例:
データ = [60, 70, 80, 90, 100]
中央値 = 80(3番目)


🔹 偶数の場合

中央の2つの値の平均を取る:

Median=xn2+xn2+12\text{Median} = \frac{x_{\frac{n}{2}} + x_{\frac{n}{2} + 1}}{2}

 

例:
データ = [60, 70, 80, 90]
中央値 =

70+802=75\frac{70 + 80}{2} = 75

 


🖥 PythonとExcelでの計算方法

▶ Python(NumPy使用)

import numpy as np

scores1 = [60, 70, 80, 90, 100]
print(np.median(scores1))  # 80

scores2 = [60, 70, 80, 90]
print(np.median(scores2))  # 75.0

▶ Excel

セルに以下を入力するだけ:

=MEDIAN(A1:A5)

🛡 なぜ中央値は「信頼できる指標」なのか?

中央値は外れ値に強く、分布の「代表的な値」を示します。
特に実務や社会データでは、中央値の方が実態に近いことが多いのです。


💰 例:会社の年収データ

  • 社員9人:年収 400万円
  • 社長1人:年収 5000万円
指標
平均年収 860万円(大きく引き上げられている)
中央値 400万円(社員の実態を反映)

中央値こそが「一般社員の実感値」に近いといえます。


🍚 応用:食料価格の分析にも有効!

以下のような価格データがあるとします:

[300, 305, 298, 310, 295, 302, 300, 299, 301, 1200, 303, 297]
指標
平均値 391(外れ値1200に引っ張られている)
中央値 301(通常価格帯を反映)

価格の実態を把握するには、中央値の方が有効ですね。


🔍 まとめ:中央値を使いこなそう

  • 中央値は**「並べたときの真ん中」**
  • 外れ値に強く、実態に近い値を示す
  • 平均と併用することで分布の歪み(偏り)も見える
  • 所得、住宅価格、食料価格、アクセス解析など多くの場面で使われる

📘 関連記事(あわせて読みたい)


🎓 もっと深く学びたいあなたへ

データ分析の基礎を学ぶなら、Udemy講座がおすすめです。
動画で学べて、実践的な演習もついてくるから初心者にもぴったり。

👉 Udemyで「統計の基本」講座を見る
icon

 

Sponsored Link

コメント

タイトルとURLをコピーしました