等分散性

等分散とは、対象とした各群のデータの分散が等しいことをいいます。
反対に、不等分散(非等分散)は、対象とした各群のデータの分散が異なることをいいます。

検定手法の中には、各群が等分散であることを前提としているものがあります。
等分散性が仮定できるかを事前に調べることで、検定手法の選択の誤りを防ぎます。
等分散性が仮定できれば、各群の分散が均等である(等分散である)ことを前提とする検定手法を、そうでなければ、各群の分散が均等である(等分散である)ことを前提としない(歪(いびつ)な分布同士のデータ群を検定できる)手法を選択します。

ルビーン検定


等分散性の検定にはルビーン検定(Levene's test)がよく利用されます。
検定の種類にもよりますが、一般に、シャピロ・ウィルク検定などで正規性が確認された後に実施されます。
この検定は2群以上の分散の均質性を検定する手法です。
この検定の帰無仮説は「各群の分散は等しい(等分散性)」です。
ルビーン検定のp値が有意水準(一般に0.05)未満だった場合、各群は均一な分散を持つとは言えないので、等分散性を仮定できないと判断します。
ルビーン検定の他にもF検定(2群の比較)やバートレット検定(Bartlett test, 3群以上の比較)があります。
一般に、逸脱した値の対応が柔軟と考えられているルビーン検定が広く用いられています。

References
  • https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.levene.html#scipy.stats.levene