はじめに
「平均」という言葉は日常生活のあらゆる場面で使われています。
テストの平均点、平均気温、平均年収…。
当たり前のように使う言葉ですが、統計学の視点からみると奥が深く、誤解されやすいポイントもたくさんあります。
この記事では、
- 小学生でもわかる直感的なイメージ
- 数学的な厳密な定義(LaTeX数式あり)
- Python・Excelでの計算例
- 平均の「落とし穴」
- 応用事例(食料価格・経済データ)
までを体系的に解説します。
🍬 直感で理解する:お菓子の分けっこ
たとえば5個のお菓子を3人で分けるとしましょう。
「みんなで平等に分けたら、1人あたり何個になるか?」
これが「平均」の考え方です。
この「1人あたり1.67個」が平均です。
実際に1.67個にはできませんが、「1人分の目安」を示すのが平均の役割です。
📊 数学的な定義
統計学では、平均(算術平均)は次の式で定義されます。
ここで、
:平均値
:データの数
:各データ
つまり「すべてのデータを合計し、それをデータの数で割ったもの」が平均です。
例:70点, 80点, 90点 の3人のテスト結果
💻 Python / Excel での計算方法
Pythonで計算
import numpy as np
scores = [70, 80, 90]
mean_score = np.mean(scores)
print(mean_score) # 80.0
Excelで計算
セルに
=AVERAGE(A1:A3)
と入力するだけで平均を求められます。
⚠️ 平均の落とし穴
平均は便利ですが、誤解を招きやすい代表値でもあります。
特に 外れ値の影響を受けやすい のが特徴です。
例:会社の年収
- 社員9人:年収400万円
- 社長1人:年収5,000万円
平均年収は:
実際には社員のほとんどが400万円なのに、「平均860万円」と言うと現実とは大きく異なります。
👉 こういうときは「中央値(データを並べたときの真ん中の値)」を使う方が適切です。
📈 平均・中央値・最頻値の比較
- 平均(Mean)
合計 ÷ 個数。外れ値に弱い。 - 中央値(Median)
データを並べたときの真ん中。外れ値に強い。 - 最頻値(Mode)
一番多く出現する値。人気やトレンドを反映。
👉 データを正しく理解するには「平均」だけに頼らず、中央値や最頻値とセットで使うのが基本です。
🌾 応用:食料価格データでの平均
年間の平均価格
小麦の国際価格
があるとすると、年間平均は:
これで「年間を通じた価格の目安」が得られます。
外れ値の影響
もし11か月が 300ドルで、1か月だけ戦争や災害で 1,200ドルになったとしたら:
「平均391ドル」と出ますが、実際にはほとんどの月が300ドルです。
👉 この場合は中央値(300ドル)を見る方が実態に近いです。
📚 ビジネスや学習での活用
- 教育現場
- テストの平均点でクラス全体の傾向を把握。
- ただし個人差や外れ値に注意。
- 経済・統計
- 平均年収・平均物価などを政策判断に利用。
- 併せて中央値や分散を確認するのが必須。
- ビジネス
- 売上の平均、顧客単価の平均をモニタリング。
- 外れ値をどう扱うかで意思決定が変わる。
✅ まとめ
- 平均=「合計 ÷ 個数」で表される代表値
- 数式で表すと:
- 外れ値に弱いので、中央値や最頻値と比較するのが大切
- 食料価格や経済データの分析にも応用できるが、「平均だけ」では不十分
次に読むとよい記事
PR:この記事で紹介した「平均」や「統計」の理解をさらに深めたい方へ
コメント