あしげ日記:2021-9-8

あしげ日記

今朝も足底腱膜炎の論文の表現の手直しをしています。

自分の書いた文なのに、それをチェックするのが異常に大変ですね。特に結果の統計的表現が適切かどうか判断するのが困難です。どうしてここまで自分の表現なのに適切か判断するのが難しいのか考えたところ、どうも傾向スコアについての理解がまだ不十分なことが理由であることにたどり着きました。

「患者さんがある複数の背景因子を持っていて、その背景因子にしたがって受ける治療が決まる場合、その背景因子次第でどちらの治療になりやすいか、傾向が出ます。それを数値化したものが傾向スコアです。すなわち、複数の背景因子を一つの数値にまとめ上げたもの、と言うことができます。

各治療において、その治療を受けた患者さんはそれぞれに傾向スコアの値(背景因子の縮約数値)を持っています。その治療を受けた2群をそのまま比較したのでは、背景因子がばらばらなので、その背景因子に影響されて、ほんとうに治療の差が結果の差と言えるのかどうかがいいかげんになります。そこで、背景因子の縮約数値である傾向スコアを使って、うまいこと2群が均質となるように調整できないか目論みます。

それぞれの群において同じ傾向スコアの人を比べた場合、「同じ背景因子を持ちながらも別の治療を受けた」という扱いになります。その人数があっていれば、無作為に2つの治療法に患者さんを割り振ったという意味になり、「ランダム化比較試験」をしたとみなせるわけですが、当然それぞれの群の傾向スコアによる分布は一様ではありません。

そこで、逆確率重みづけによって各群の人数調整を行い、各傾向スコアにおける両群の人数分布が一致するようにして、両群を治療成績を比較可能にします。

ただ、それは背景因子を縮約した傾向スコアで両群の人数調整を行っただけで、本当に両群のそれぞれの背景因子がそろっているのか、確認する必要があります。それが、人数調整後の各背景因子の標準化差の比較です。それは逆に、そもそも背景因子を調整するために導入した傾向スコアが適切なものであったのかを判断する材料となります。

これで一つの傾向スコアを用いた解析の一つの流れになりますが、問題なのはC統計量と呼ばれる値ですね。これについては、入れるべきと書いてあるものと入れても意味はない、と書いてあるものとがあるので、どちらにするか迷い中です。C統計量と言うのは、傾向スコアを算出したロジスティック回帰モデルが、各群への割り付けを的確に言い当てているかどうかの指標です。この、「各群を適切に言い当てる」ということが、傾向スコアを算出するモデルに求められる要素かどうか、ということで議論が分かれています。ただ、背景因子をまとめ上げたモデル式がきわめて厳格に2群への割り当てを識別できるものである(C統計量が高い)とすると、それはもはやその背景因子がまようことなく片方の治療への割り当てを決定づけるものであることを意味するので、そんな傾向スコアを作成すること自体ナンセンスとなります。とすると、そのC統計量は結局何を見たいのか、という点においてあいまいです。」

・・・などとブログを使いながら自分の頭の中を整理していますが、やはりC統計量は入れない方がよさそうですね。余計なことを入れると流れが損なわれます。

タイトルとURLをコピーしました