あしげ日記:2021-4-24

あしげ日記

今朝は統計の勉強をしていました。

現在、アキレス腱付着部症の内視鏡手術の論文と、足底腱膜炎の内視鏡手術の論文の2つを進めています。アキレス腱付着部症のような全員内視鏡手術を行った1つの群の術前術後の比較だと、手術前と手術後は同じ人たちなので、「手術をした」ということ以外の条件はそろっており、純粋に手術前後で差があったのかどうかだけを調べればよかったのですが、足底腱膜炎の論文では、内視鏡下足底腱膜切離術と内視鏡下骨棘切除術を行ったグループは違うグループなので、背景因子がそろっているかどうかを評価・調整しなければなりません。

その評価・調整に統計の知識が必要となるので、統計の勉強をしています。特に選り好みして「ある人には切離術、ある人には骨棘削り」というふうにはしていないので、おそらく2グループは似た背景因子を持っているでしょうから、年齢やら肥満度やら術前の痛みスケールやらの平均値を出して、「両グループの背景因子は似ていました」とやってもそう大きくは問題ないのですが、どうせやるならもう少しちゃんとやろうと考えています。

その統計的手法としては、多変量解析が必要となってきますが、その理解がまだ不十分だと痛感します。多変量を用いて線形結合のモデル式を作り出すことは分かっていても、その線形結合で表した式をどう使って評価につなげていくのか、というところの理解が不十分でした。

自分の論文でおそらく使える多変量解析の一つは「傾向スコア」という手法で、背景因子からある治療法が選ばれる確率を出すモデル式を算出し、その式に従って各患者さんの確率を計算、その確率が同じくらいだけれども別の治療となった人たちをマッチングさせ、「背景因子的には似ているけれども違う治療法となった2グループを比較する」という方法です。この手法によって、疑似的な無作為化対照試験を作り出すことができます。

この傾向スコアでは、アウトプットは「ある治療法か別の治療法か」すなわち「0か1か」という2値変数だったので、ロジット関数を選べばよいのですが、今日「リアルワールドデータの統計解析」の本を読んでいたら、アウトプットとして連続変数をとるような多変量の線形結合式を作る方法も書かれており、それが自分のケースでは、何を独立変数・何を従属変数とし、何と何とを比較するのかがよくわかりませんでした。おそらく、線形回帰分析の理解が足りていないのでしょう。

もっと勉強してどの評価法を選ぶべきか検討する必要がありそうです。

タイトルとURLをコピーしました