« クイズ:あなたが○○だったら(陪審員編) | メイン | 「正義」のコスト »

DNA鑑定についてのベイズの定理のインプリケーション

(1/23追記あり) 

ベイズの定理を使うことで、もう一つ興味深い洞察を得ることができるのが、多分、DNA鑑定をはじめとした科学的な証拠の訴訟における意味合いではないかという気がします。

次のような例を考えてみましょう。

ある絶海の孤島で、殺人事件が起きました。
島の人口は1000人。手がかりは、被害者の衣服についていた犯人のものと思われる血痕だけ。
なぜか、その島に滞在していた名探偵の子孫は、大胆な推理で、ある男Xが犯人だと名指ししました。
Xは、必死に否定しますが、名探偵の子孫は、自身満々に、「DNA検査をしてみれば、一致するはずです」と言い放ちました。
そして、DNA鑑定の結果は・・・見事に一致しました。
名探偵の子孫は、自信満々に言い放ちます。
「DNA鑑定の精度は99.9%・・・つまり、1000回に1回しか間違わない。もう、言い逃れはできませんよ」

・・・と、これを先回のベイズの定理を使って検証してみましょう。
まず、真犯人は、1000人の中に一人必ずいるとします。

ということは、Xが真犯人であって、かつ、DNA検査で一致する確率は、0.001×0.999=0.0999(%)です。
次に、Xが真犯人ではないのに、DNA検査が一致してしまう確率は、0.999×0.001=0.0999(%)です。
ということは、DNA検査が一致した場合に、Xが真犯人である確率は・・・計算するまでもありませんね、50%に過ぎません。

これでは、とても刑事事件でいう「合理的な疑いを入れないほどの証明」ということにはならないことは明らかです。
でも、「99.9%の精度のDNA鑑定で鑑定結果が一致した」というと、これはほぼ間違いないだろうというのが普通の感覚ではないでしょうか?これは何故でしょう?

この結果は、「事前確率」において犯人でない確率が極めて高い(99.9%の確率で犯人ではない)ことから生じています。DNA鑑定を有効なものにするためには、この「事前確率」を他の証拠を使って絞り込むことが大切になります。
たとえば、上の例で、村人のうち900人にはアリバイがあったとしましょう。
すると、Xが真犯人である確率は、0.01*0.999/0.01*0.999+0.99*0.001=0.91ということで、確率は一気に90%にあがるわけです。

ところで、上の計算では、真犯人ではないのにDNAが一致する確率を0.1%(100%-99.9%)とおきましたが、実際には、これは必ずしも正しくはありません。例えば、真犯人と一致する確率は99.9%である一方で、関係ない他人と一致する確率は極めて低く、0.01%しかないということも考えられます。
逆に、真犯人に対して99.9%の確率で反応する一方で、真犯人ではない場合にも1%の確率で反応してしまうような場合も、可能性としては考えられます。

私は実際の検査方法について余り知らないので、何ともいえないのですが、直観的には、金属探知機と同じように、確実に真犯人の場合には一致するような検査方法をとろうとすると、感度が敏感になって真犯人でない場合にも反応する確率も高くなるということはありそうです(Type I errorを減らそうとすると、Type II errorがそれだけあがる)・・・つまり、真犯人なら99.9%の確率で反応するが、そうでない場合にも1%の確率で反応してしまうというようなことは、理論的に考えると、十分ありそうな話です。

この場合、ベイズ統計理論による確率は、0.001*0.999/0.001*0.999+0.999*0.01=0.09ということになり、なんと10%にも満たないことになります。このことは、つまり、DNA鑑定の精度を考える上では、単に真犯人の場合に反応が出るという意味での信頼性のデータだけでは不十分であって、真犯人ではない場合にも反応が出る確率がどの程度あるかという意味での信頼性のデータが不可欠ということを意味しています。

私は、DNA鑑定の刑事実務を知らないのですが、この後者の意味での信頼性のデータというのは、どの程度明らかにされているのか、また、前者の意味での信頼性ときちんと区別がなされているのか・・・この辺りはちょっと気になるところです。

(1/23追記)

かつおどりさんのコメントを受けて、一応上の記事の範囲で考えていたことはコメント欄で、もう少し詳しく書いたんですが…確かに、実際のDNA鑑定のプロセスの中で、①被疑者が真犯人で反応が出る確率と②被疑者が真犯人ではないのにもかかわらず反応が出る確率というのは具体的にどうやって導かれるのかということについて、ちょっと気になりだしたので、とりあえず思いついたことを書いてみると…


まず、①の確率の方ですが、こちらの方は、スタートポイントは、同一人物から採取した資料をベースにした複数回試行を、複数の人について試せば、かなり信頼度の高い確率が出せそうです。例えば、100人について、1000回の試行を試せば、信頼度99%でも、信頼区間はかなり狭くなりそうな予感です。

次に、資料の状態や採取方法に応じて、上の確率にどのような影響が出るのかも、これも、ある程度は実験室でデータが得られそうです。例えば、布にしみこんで3日間経過した血液が資料だった場合はどうかとか、資料を分離するのにある種の化学薬品を用いた場合はどうかとか、そういう類のデータも、実験室で試行を繰り返すことで得られそうです。

というところからすると、総じて、①真犯人である場合に反応が出る確率については、事前に相当のデータが得られそうな気がします。

難しいのは、やはり②の方ですね。

まずは、理論的な出現頻度の問題があります。例えば、資料から採取したDNA形が日本人なら1000人中3人の確率で出現する
ものだとしたら、その違う2人が反応する可能性があります。よく報道なんかで言われるのは、この意味での確率のような気がしてきました。

次に、資料の状態や採取過程によって、本来、資料が顕現すべきDNA形と異なるDNA形が検出される可能性がありそうです。これは、①の裏側になるんでしょうか?99.9%の確率で正しいDNA形が検出されるということの裏側は、0.1%の確率で誤ったDNA形が検出される可能性があるということになりそうです。これは、上の意味での確率論とは異なって、そもそも出現率が1000人中1人だとしても、資料自体が顕現したDNA形が誤っているために誤った結果が出る可能性です。

最後に、例えば、私は、この辺りは全く疎いので分からないのですが、DNA鑑定というのは、デジタルコードのように一致しているかいないかは、0か1かのデジタルの世界なのか、それとも、似顔絵と実際の犯人の顔を見比べるかのように、非常に似ているとしても別のものである可能性も否定できないという領域が残るアナログの世界なのか?…もし後者だとすると、この場合の信頼度はどのぐらいのものなのだろうというところも関係します。
統計なんかでは、95%や99%の信頼度が用いられますが、上の例で見たように、5%や1%の率で、誤った判定がなされる可能性が残るというものだと、事前確率での絞り込みが非常に重要になってきそうです。

…というわけで、余計混乱してきた感もありますが、ともかく、実際のDNA鑑定についてみるときには、かつおどりさんが指摘されているように、どういう手法でどういう意味合いの確率が提示されているのかをきちんと区別することが非常に重要になってくるということではないかと思います。

ひょっとしたら、こんなことは刑事弁護の世界ではもう当たり前なのかも知れませんが…

Posted by 47th : | 17:13 | Law & Economics

関連エントリー

トラックバック

このエントリーのトラックバックURL:
http://WWW.ny47th.COM/mt/mt-tb.cgi/247

コメント

wikipediaに

確率論(かくりつろん、Probability theory)とは、確率的な予言しかできない偶然現象に対して数学的なモデルを与え、厳密に解析する数学の一分野である。

とあります。

「99.9%の精度のDNA鑑定」をどう定義するか・どう測定したかを言わずに、ベイズの定理に持ち込むのは、概念をずらして使っているような気がするのですが。

Posted by かつおどり : 2006年01月22日 20:40

>かつおどりさん
ブログの特性とちょっと分かりやすさを優先させたために、統計について詳しい方には物足りない記述になっている点はご海容下さい。その上で、以下のような考え方に問題があれば、教えていただきたいのですが・・・
私自身は実際に用いられているDNA鑑定の具体的な手法や信頼度に関しては余り詳しくないので、仮定として、あるDNA鑑定手法の下において、①真犯人のDNAが標本から検出したDNAと一致する確率と、②真犯人以外のDNAであるにもかかわらず標本から検出されたDNAと一致する確率という2つの確率が、何らかの統計的に信頼できる手法でテストされており既知であるという状況を想定しています。(この確率の要因には、プロセスの過程で生じ得るものと結果自体の出現頻度などがあると思いますが、その内容はここでは特に区別せずに結果だけについて見ています)
最初の囲みの例示の部分では、一般に①と②が余り区別されていないように使われていることから、意図的に「精度99.9%」という表現を使って、①+②が常に100%となるという暗黙の前提を置いてベイズ定理を使って事後確率を算定しています。
その上で、後半のところでは、①+②=100%という関係は必ずしも自明ではなく、むしろ、Type I errorとType II errorの通常の関係からいうと、①を高めようとすると、②も高まるという関係もあり得るので、DNA鑑定の信頼性を考える上では①の確率だけではなく、②の確率も高まる可能性もある。従って、②についても着目する必要があるという含意を導こうとしました。
以上の分析は、根拠文献に基づいたものではありませんので、何か誤り等あればご指摘頂ければ幸いです

Posted by 47th : 2006年01月22日 23:00

すいません言葉が不足していました。
ブログ読んでてフンフンと納得しかけて、何か違和感を感じるのは何故か、と考えたら、
たとえばDNA検査で
①肯定の肯定・否定実験
②否定の肯定・否定実験
の両者を合算・平均してトータルの確率を言うかな?と思ったんです。そう読みにくいコメントですが、その趣旨でコメントしました。

その後、ちょっと調べたら、
「DNA親子鑑定鑑定だと肯定で99.999%以上(親子3人の参加の場合)、否定で100%の結果」
などという記述があったので、たぶん実務的には両者の精度が一緒には扱われていないような感じがしましたのでまたコメントします。

Posted by かつおどり : 2006年01月22日 23:41

>かつおどりさん
ありがとございます。追記でもう少し考えてみたので、そちらもご覧いただけると幸いです^^

Posted by 47th : 2006年01月23日 00:20

 
法律・経済・時事ネタに関する「思いつき」を書き留めたものです。
このブログをご覧になる際の注意点や管理人の氏素性についてはAbout This Blogご覧下さい。