あしげ日記:2021-4-25

あしげ日記

今朝は「統計学図鑑」の回帰分析のところを読んでいました。

昨日のブログで、2群を比較するのにいくつか独立変数から連続量の従属変数を算出するモデル式をつくり、そのモデル式同士を比較する方法があるようだ、という話でしたが、どうも理解に行き詰って、それは回帰分析がよくわかっていないからではないか、ということに行き着いたので、今日は統計図鑑を読んでみました。

この統計学図鑑はとてもいい本です。統計的な内容が適切な絵と平易な文で説明されているので、概略をしっかりとらえるのに適しています。

やはり読んで正解でした。いくら多変量のモデル式になろうとも、そのもととなるのは y = ax+b の直線の式とか z = ax+by+c の平面の式であって、そこに帰着して考えれば理解を外さないことがわかりました。

また、多変量解析でのモデル式の作成で、互いの変数の独立や交絡因子の調整が問題となるのも、直線や平面の式に帰着して考えれば当たり前の話でした。さらに、そうして作った2つのモデル式が同一と見なせるかどうかも検定についても、2つの直線の式が同一かどうかと同じように考えればいいだけの話でした。

ただここまで来て、こんな面倒な手法で解析すること自体、自分の論文にとって意味の少ないことだということもわかりました。こういうのは大学受験でも経験済みですが、ある数学の問題でいくつかの解法があったとき、たしかにほかの方法でも解けなくはないが、その方法で解くととても面倒なことになるので選択しない、というのはよくあります。統計でも面倒な解析法をわざわざ選択する必要はありません。

すると、自分の足底腱膜炎内視鏡手術の足底腱膜切離vs骨棘削りにおいても、傾向スコアで交絡因子の調整をしたうえで、治療効果を対応のある t 検定で調べるのがもっとも簡単で間違いの少ない方法だということを実感しました。考えてみれば、傾向スコアによって疑似ランダム化比較試験になるならば、これほどよいことはない、といえます。ランダム化比較試験は最強の研究手法なわけですから、疑似でもそれに近い状態を作り出せれば、それに勝る解析方法はなかなかないわけです。

統計学図鑑を読んでうまく線形回帰分析による解析と決別できましたので、傾向スコアの具体的な方法について勉強していきたいと思います。

タイトルとURLをコピーしました