データと変数

 記述統計や検定における変数


記述統計や検定における変数は、「確率変数」とまとめて呼ばれることが多いです。
予測統計や因果分析と異なり、群の特徴を客観的に示す指標の算出や群間の比較を行うため、
変数に役割を設けることはあまりないと考えます。
例えば、身長、体重、年齢のデータを使うとなった場合、これらすべてが確率変数です。
目的に応じて、確率変数を取捨選択して分析に用います。

因果分析や予測統計における変数


データに変数の種類を設け、役割を持たせます。
独立変数と従属変数です。
独立変数は別名で説明変数、従属変数は目的変数とも呼ばれます。
因果分析では独立・従属変数という呼称が、推計統計(とくに予測統計)では説明・目的変数という呼称がよく利用されます。
(因果分析と予測統計の)研究者によって解釈が分かれるかも知れませんが、これらは一般的に同じものです。
原因となった要因が「独立変数」であり、その結果現れるものが「従属変数」です。
例えば、「身長・体重・年齢・毎日の平均摂取カロリー」などを独立変数とし 「血清コレステロール値(LDL)」を従属変数とするなどです。

独立変数と従属変数は、単純な関数の式 y = f (x) で説明されることが多いです。
この式のxが独立変数、yが従属変数です。
xは独立な値をとり、yは x に応じて(それに従属して)値が定まります。
実際の f (x) の式は、利用する統計モデルによって複雑な式に置き換えられます。
予測統計では予測モデルを作成しなければなりませんから、その際に予測対象となる従属変数を教師ラベルとして、独立変数をパターンを学習するためのデータとして利用します。
このような理由で、予測統計では変数を独立変数と従属変数に分けます。

Visionary Imaging Services, Inc.