調査や測定などの結果得られた集団の特徴を推定する場合、母集団がわかっていればいいのですがそうでない場合推定しなければなりません。
母集団の平均 と母分散
がわかっている場合はいいのですが、わからない場合は得られたデータから推定していきます。
例えば、テレビの製造現場で製品チェックを行う場合、すべての製品の品質チェックを行うのは現実的ではありません。
そこで、一部の標本を取り出し、統計的な特徴を推定することで商品全体の品質管理を行います。
Sponsored Link
不偏推定量とは
母集団の平均 と分散
が標本平均
と標本分散
として表せる場合不偏推定量といい、以下の式が成り立ちます。
- 母平均
の不偏推定量 =
- 母分散
の不偏推定量 =
この場合、標本平均 はそのまま母平均
として使えますが、母分散
は不偏標本分散を使います。
ちなみに不偏標本分散の公式は、以下になります。
不偏推定量:練習問題
不偏推定量を求める練習問題をやってみます。
問題はいつものように、演習で身につける統計学入門から出題です。
高校1年生が英語の試験を行い、生徒8名を無作為に選んだ結果、彼らの点数は以下の通り。
56,70,91,58,47,67,81,78
1年生全体を母集団として、得たデータから母平均と母分散の不偏推定量を求める。
という問題をPythonを使って計算してみましょう。
import numpy as np eng = np.array([56,70,91,58,47,67,81,78]) eng_mean = np.mean(eng) # 標本平均を求める。 eng_var = np.var(eng, ddof = 1) # 不偏標本分散を求める。 print(eng_mean) print(eng_var) 68.5 # 標本平均 212.28571428571428 "不偏標本分散
とりあえずnumpyに平均を求めるモジュールや分散を求めるモジュールがあるので、それを使います。
結果は標本平均が68.5点なので、母平均 も68.5点が不偏推定量となり、標本不偏分散
は212なので、母分散
の不偏推定量となります。
Sponsored Link
コメント