感染率が少ない状況では、感染検査(偽陽性率20%)をしても陽性者の99.95%は感染していない偽陽性者です。偽陽性率2%の優れた検査法を用いても、陽性者の99.5%は感染していない偽陽性者であることが分かります。ベイズの定理を使って証明してみましょう。
[問題]人口1億人の国で1万人がある感染症に罹っています。この感染症の罹患(りかん)率は0.01%です。今、偽陽性率が20%、偽陰性率が2%の感染試験法があります。Xを罹患あり、X(―)を罹患なしの確率変数とします。Yを陽性の確率変数、Y(―)を陰性の確率変数とします。
|
陽性(Y) |
陰性(Y(―)) |
罹患有(X) |
98% |
2%(偽陰性) |
罹患無(X(―)) |
20%(偽陽性) |
80% |
1)陽性確率P(Y)はいくつですか?
2)陽性者が罹患者である確率P(X|Y)はいくつですか?
・偽陽性率とは罹患していない人を罹患している(陽性)と判定する確率です。
・偽陰性率とは罹患している人を罹患していない(陰性)と判定する確率です。
この感染症の罹患(りかん)率は0.01%ですから、
・P(X)=0.0001、P(X(―))=0.9999
罹患者かつ陽性者である確率をP(X,Y)と表します。P(X,Y)=P(Y,X)=P(X∩Y)
罹患者が陽性者である確率をP(Y|X)と表します。
|
陽性(Y) |
陰性(Y(―)) |
罹患有(X) |
P(Y|X) |
P(Y(―)|X) |
罹患無(X(―)) |
P(Y|X(―)) |
P(Y(―)|X(―)) |
罹患者かつ陽性者である確率P(X,Y)は、罹患者である確率P(X)と罹患者が陽性者である確率P(Y|X)の積で表されます。乗法定理
・P(Y,X)=P(Y|X) P(X) =P(X|Y) P(Y)
が成り立ちます。これを変形し
・P(Y|X)=P(Y,X)/P(X)=P(X|Y) P(Y) /P(X)
と表したものをベイズの定理と呼びます。加法定理は
・P(Y)=P(Y,X+X(―))=P(Y,X)+P(Y,X(―))
です。陽性者は陽性判定された罹患者と陽性判定された非罹患者からなります。
乗法定理より、陽性者である確率P(Y)は
・P(Y)=P(Y|X) P(X)+P(Y|X(―)) P(X(―))=0.98・0.0001+0.20・0.9999=0.200096
と表され、ほぼ20%です。陽性者が罹患者である確率P(X|Y)は
・P(X|Y)=P(Y|X) P(X)/P(Y)=0.98・0.0001/0.200096≒0.0005
つまり0.05%です。つまり罹患率0.01%の感染症が、感染試験によって5倍の確率で感染症を見つけることができるようになったことが分かります。逆に言えば感染率が少ない状況では感染試験をしても陽性者の99.95%は感染していない偽陽性者であることが分かります。
[コメント]
罹患Xが原因、陽性Yが結果だと考えると、P(Y|X)は原因が生じた下での結果が起こる順確率を表しています。つまり罹患者が陽性者である確率98%を表しています。一方でP(X|Y)は結果が起こった下での原因が生じた逆確率を表しています。つまり陽性者が罹患者である確率0.05%を表しています。
ベイズの定理:
・P(X|Y)=[P(Y|X)/P(Y)]×P(X)
は逆確率を順確率で表現する方法を与えています。事後確率P(X|Y)は事前確率P(X)の[P(Y|X)/P(Y)]倍になります。
偽陽性の確率が2%のときは、陽性者が少なくなり
・P(Y)=P(Y|X) P(X)+P(Y|X(―)) P(X(―))=0.98・0.0001+0.02・0.9999≒0.02
・P(X|Y)=P(Y|X) P(X)/P(Y)=0.98・0.0001/0.02≒0.005=0.5%
つまり罹患率0.01%の感染症が、感染試験によって50倍の確率で感染症を見つけることができるようになったことが分かります。しかし陽性者の99.5%は感染していない偽陽性者であることが分かります。