共分散分析

共分散分析の概要


分散分析では交絡要因を共変量として解析する共分散分析( ANalysis of COVAriance, ANCOVA)という手法があります。
共分散分析は、言い換えれば、「相関の検定」と「対応のある1要因の多群の分散分析」とを組み合わせた手法です。
独立変数による従属変数値の変動の中から、従属変数と交絡のある共変量(剰余変数ともよばれます。 背後に存在する原因と結果への影響因子、あるいは、結果と“共”に変わる原因と思われる“変量”です)の影響を極力排除して群を比較することを目的として用いられます。
例えば、血圧を下げる薬AとBを使って、薬剤Aの投与群と薬剤Bの投与群をつくり、年齢と、投与後の血圧を集めたとします。
年齢が高い人は血圧が高い傾向(相関)があったとします。
この場合、独立変数は薬の種類、従属変数は血圧、共変量(剰余変数)は年齢です。
このデータを使って共分散分析を行う場合、その帰無仮説は「年齢の影響を考慮しても群間の差はない」です。
N元配置分散分析との違いは、相関を加味するか否かです。

データの構造


ANCOVAでは共変量という役割をデータに設定します。
データは次のようになります。
※このデータは群を列方向に記載していますが、実際に解析に用いるデータは、行方向にまとめます。

薬A群 薬B群
ID 年齢(共変量) 血圧 ID 年齢(共変量) 血圧
1 45 190 101 60 210
2 58 200 202 57 180

フロー


共分散分析は基本的にパラメトリックな検定です(ノンパラメトリックな検定として扱う場合は、従属変数を順位尺度に変換してからANCOVAを実行するなどの手法なども検討されています)。
まず最初に、相関分析を行い、共変量として設定される変数とその他の変数とで相関があるかを確かめておきます。
他の分散分析と同様に、変数の正規性を各群で確認しておきます。
相関がない場合は共分散分析は行えません。
相関がある場合、線形回帰を確認します。
回帰直線が原点を通る場合は、共変量を除いた変数での分散分析に切り替えます。
回帰直線が原点を通る場合の分散分析は、従属変数を共変量で除した値を用いると、共変量の影響を無くすことができます。
回帰直線が原点を通らないことが確認できたら、回帰直線の平行性を確認します。
共変量ともう一方の変数とは相関が認められているため、直線回帰を仮定した上で、群ごとに回帰直線を計算します。
群間の回帰直線同士の勾配(傾き)が大きく異なる場合、平行性は否定され、群間比較は信用できないと考え、共分散分析は適切でないと判断します。
適切と判断された場合は、ようやくANCOVAを実行できます。

実践


2つの薬剤を対象に年齢と血圧の調査を実施したサンプルデータを用いて、2つの薬剤群の血圧に年齢(共変量)によって差があるかどうかを検討したいとします。


Visionary Imaging Services, Inc.