Sponsored Link
🧭 はじめに:なぜ中央値が重要なのか?
「平均値(mean)」は便利ですが、実は外れ値にとても弱い指標です。
極端な数値が1つあるだけで、全体の印象が大きく歪んでしまいます。
一方で、「中央値(median)」はデータの真ん中の値を表し、外れ値に影響されにくいのが特徴です。
統計や実務分析では、中央値が現実をより的確に表す場面がたくさんあります。
👦 直感的なたとえ:「身長で並ぶ」とわかりやすい!
たとえば、クラス全員を身長順に1列に並べたとしましょう。
このとき、**ちょうど真ん中にいる人の身長が“中央値”**です。
片方にはそれより低い人、もう片方にはそれより高い人が並んでいます。
🧮 数学的な定義(奇数と偶数で異なる)
中央値の計算方法は、データ数
が奇数か偶数かで変わります。
🔹 奇数の場合
昇順に並べたときの中央の値が中央値:
例:
データ = [60, 70, 80, 90, 100]
中央値 = 80(3番目)
🔹 偶数の場合
中央の2つの値の平均を取る:
例:
データ = [60, 70, 80, 90]
中央値 =
🖥 PythonとExcelでの計算方法
▶ Python(NumPy使用)
import numpy as np
scores1 = [60, 70, 80, 90, 100]
print(np.median(scores1)) # 80
scores2 = [60, 70, 80, 90]
print(np.median(scores2)) # 75.0
▶ Excel
セルに以下を入力するだけ:
=MEDIAN(A1:A5)
🛡 なぜ中央値は「信頼できる指標」なのか?
中央値は外れ値に強く、分布の「代表的な値」を示します。
特に実務や社会データでは、中央値の方が実態に近いことが多いのです。
💰 例:会社の年収データ
- 社員9人:年収 400万円
- 社長1人:年収 5000万円
指標 | 値 |
---|---|
平均年収 | 860万円(大きく引き上げられている) |
中央値 | 400万円(社員の実態を反映) |
中央値こそが「一般社員の実感値」に近いといえます。
🍚 応用:食料価格の分析にも有効!
以下のような価格データがあるとします:
[300, 305, 298, 310, 295, 302, 300, 299, 301, 1200, 303, 297]
指標 | 値 |
---|---|
平均値 | 391(外れ値1200に引っ張られている) |
中央値 | 301(通常価格帯を反映) |
価格の実態を把握するには、中央値の方が有効ですね。
🔍 まとめ:中央値を使いこなそう
- 中央値は**「並べたときの真ん中」**
- 外れ値に強く、実態に近い値を示す
- 平均と併用することで分布の歪み(偏り)も見える
- 所得、住宅価格、食料価格、アクセス解析など多くの場面で使われる
📘 関連記事(あわせて読みたい)
- 平均とは?算術平均をやさしく解説
- 分散と標準偏差:データの広がりを測る指標
- 分布の歪度(スキュー)とは?実例で解説
🎓 もっと深く学びたいあなたへ
データ分析の基礎を学ぶなら、Udemy講座がおすすめです。
動画で学べて、実践的な演習もついてくるから初心者にもぴったり。
Sponsored Link
コメント