あしげ日記:2021-5-25

あしげ日記

今朝も傾向スコアの勉強をしています。

逆確率重みづけについてよくわからず、いろいろなサイトを見ているうちに、統計家「頑健な妻」さんのブログにたどり着きました。

ここの逆確率重みづけの説明がもっともわかりやすかったです。傾向スコアは、比較する2グループに分かれるときの、注目する1グループに入る確率を意味しますが、その逆数は何を意味するかというと、そのグループに入らない人も含めた人数を意味します。例えば、ある入試において、合格者/不合格者の2グループを考えたとき、1人合格で2人不合格の場合、合格の確率は1/3ですが、その逆数3/1は合格者・不合格者トータルの人数を意味します。

傾向スコアは、ある集団を2グループ分けしたときに、実際には注目するグループに含まれてはいない人たちもその注目するグループに含まれると仮定したことによって得られた均一性(すなわち、全員が片方のグループに入ったケースと、全員がもう片方のグループに入ったケースを考えれば、これらの仮想的な2グループは均質な集団と見なせる)を土台にした理論ですので、傾向スコアの逆数を取ることによって、反対のグループに属する人たちの分も考慮に入れた計算ができる、というのが肝ですが、それを上の写真のような絵を用いて分かりやすく説明していました。

この理解によって、「全ての対象者における平均的な処置効果(Average Treatment Effect: ATE)」と、「実際に処置をうけた対象者における平均的な処置効果(Average Treatment effect on the Treated; ATT)」という、傾向スコアの説明で最初に出てくる、似ていて何だかよくわからない用語の意味も直観的に理解することができました。

統計の勉強をしていて思いますが、女性の統計家の方が説明がうまいですね。女性の方が言語化がうまいことや、男性のように説明を小難しくして自己顕示する意図がない、ことによるのかと思います。

昨日の日記で、傾向スコアもEZRでできるようになったので統計ソフトRの勉強をする必要がなくなったことを書きましたが、この逆確率重みづけは、まだEZRには完全装備されてなく、Rでのプログラミングが一部必要とのことです。この点もちょっとやる気が増しました。

タイトルとURLをコピーしました