度数分布(ヒストグラム)は、縦軸に度数、横軸に階級(昇順に並んだデータのbins)をとった統計グラフの一種です。
度数は、頻度を意味します。
binsというのは、データを値域(ちいき、range)ごとに分類したときの単位です。この値域は階級とも解釈できます。
例えば、1〜100までの値を、1〜10、11〜20、…91〜100の10個の値域に分けた場合は、10binsになります。
1つずつ分けた場合は、100binsです。
データの分布状況を把握するために用いられ、正規分布を計算するための元データになります。
試してみましょう
ここではシミュレーションデータで確認していきます。
例えば、ある町に住む1000人の男性の身長を対象に度数分布を調べるとしましょう。
平均は165cm、分散は3の正規分布を示す架空のデータを使います。
正規分布については別のテーマで解説します。
ここでは、釣鐘型の左右対称なヒストグラムの分布のようなものとして読み進めて下さい。
手順としては、身長データを作成、ヒストグラムを描画という流れになります。
ランダムに値を取得する関数を使っているので、全く同じデータにはなりません。
次のようにしてみました。
# ヒストグラムの描画
import numpy as np
import matplotlib.pyplot as plt
# 身長のデータセット
x = np.random.normal(
loc = 165, # 平均
scale = 3, # 標準偏差
size = 1000,# 出力配列のサイズ
)
mean = np.mean(x)
sigma = np.std(x)
print("mean",mean,"sigma",sigma)
fig = plt.figure()
#ヒストグラム
plt.hist(x,bins=100)
plt.xlim(np.min(x), np.max(x))
plt.show()
横軸は身長1cmごとの階級(値域)、縦軸は度数(値のカウント)を表しています。
Visionary Imaging Services, Inc.
Imaging CROサービスをご提供させていただきます。
お問い合わせお待ちしております。
https://www.vis-ionary.com/