検定を大まかに理解する

検定は、仮説が成り立つかどうか調べるための方法の1つです。
仮説は主に2種類しかありません。
  • 「AとBとの差はない」「AとBは同じである」とする帰無仮説
  • 「AとBとの差がある」「AとBとは異なる」という事を主張する対立仮説
例えば、帰無仮説であれば、2つのグループ(2群)を比較して、「αグループの男性の身長とβグループの男性の身長とに差がない」と仮定するなどで使います。
2群以上のグループを比較する場合でも利用できます。
例えば3群であれば、「健常群、疾患A群、疾患B群では奏功効果に差がない」と仮定して、全体と各要素との比較を行うこともできます。
帰無仮説の場合、仮説通りになる可能性が高いと判断されれば、「各群の奏功効果に差があるとは言えない」と主張できます。

特に重要な考え方は、正規分布を用いた確率による説明です。
玉入れを例にして考えてみましょう。

玉入れで考える差異の有無


AグループとBグループの2群に分けて考えます。
Aグループは大人のみ、Bグループは小学校低学年(+担任)のグループです。
帰無仮説は、「AグループとBグループの得点力に差はない」です。

観測データは、(多いですが)1万回勝負して、カゴに入った玉の数としましょう。
その結果、次のような結果が得られたとします。
データは正規分布に従うとします。

Aチームの平均は70、標準偏差は10
Bチームの平均は40、標準偏差は15

これらの結果から、仮説を検証します。
Aチームのスコアを使って標準正規分布を描き、Aチームの代表値(平均値)と標準偏差で標準化されたBチームの代表値(平均値)が、Aチームの得点の範囲にくる確率を求めます。

どの程度の階級であれば、AチームとBチームとの得点力が同じとみなすかは、最初に決めておく必要があります。
例えば、最低でも5%以上の確率で、Bチームの得点の平均値が、Aチームの得点範囲内に位置する場合は、得点力は同じになる可能性があると見なし、仮説が成立するとしましょう。

ここでいう5%というのは、正規分布を俯瞰して両端をみたときの、左側(下側)2.5%以上、右側(上側)2.5%以下(97.5%以下)の階級に位置する確率とします。
計算して確かめてみます。


今回の結果は0.1%となりました。つまり、BチームがAチームと同等の得点力をもつ確率は0.1%ということになります。
また、この結果から、Bチームの代表値(平均値)はAチームの標準正規分布の下側2.5%以上、上側2.5%以下(97.5%以下)の範囲にある階級に属す可能性は非常に低いという結果となりました。
よって、仮説は外れました。
このような状況を、統計的には、「帰無仮説が棄却された」「対立仮説が採択された」などと言います。

このように、検定は、仮説、データの代表値、正規分布を元に、帰無仮説と対立仮説を主張する材料を作るための手段になります。

今回は正規分布を前提としていましたが、正規分布を前提としない、パラメトリックな手法を用いる場合でも、似たような考え方で仮説の検証について考えることができるのではないでしょうか。

Visionary Imaging Services, Inc.
Imaging CROサービスをご提供させていただきます。
お問い合わせお待ちしております。
https://www.vis-ionary.com/