母集団と標本

データの集合(母集団・標本・群・個体)


データの集合について意味を整理します。
データの集合は、母集団、標本、群、個体に分けられます。
  • 母集団は、真の意味での全体(全個体)を意味します。
  • 標本は、母集団のうちの一部の集合を意味しています。
  • 群は、標本を解析データとして分けたときのそれぞれのデータセットをいいます。
  • ※ときに、群を水準として説明されることがあります。本来、水準は、観察される変数と数値を対応させる基準です。群のデータから特定の1つの尺度を取り出し、そこからさらに分類するときの基準となります。例えば、身長、体重、年齢、血圧のある群のデータセットから、身長のデータのみを考えるとき、身長を10cmきざみの階級に分けて考えたとします。この場合、150cm、160cm、170cm、180cm、190cm...のように分類する基準が水準です。
  • 個体は1つの観測対象です。

例えば、インフルエンザを対象に研究を始めたいとします。
この場合、全宇宙に存在する全てのインフルエンザに罹っているヒトの集合が母集団です(全個体)。
しかし実際に研究対象にできるのは、ここ数年の期間で、日本に住んでいる方で、病院を受診し、確定診断された人のみとします。
このような対象は母集団の一部ですから、標本と呼びます。
そして、実際に調査できた対象者は、個体です。
さらに、個体から得た観測データ(検査値や問診など)を、調べたいテーマに従って分割し、比較を行います。
このときに分割されたデータは群です。


Visionary Imaging Services, Inc.