而して

ノートとかメモとか。

三囚人問題

有名問題。

ある刑務所長は3人の囚人の中からランダムに1人を選んで解放し, 残りの2人を処刑する. 看守は誰が解放されるか知っているが, どの囚人にも彼が開放されるかどうか教えることは禁止されている. 囚人を  X, Y, Z と呼ぶことにしよう.  X は看守に  Y Z のどちらが処刑されるか尋ね, 私は  Y Z のどちらかが処刑されることは知っているので, 看守がどちらが処刑されるかを教えても, 私の状態について情報を漏らしたことにはならないと主張した. 看守は  X Y が処刑されることを伝えた.  X は, 彼か  Z のどちらかが解放されるので, 彼が解放される確率は今や  1/2 であり, 以前より幸せに感じている. 彼は正しいか, それとも彼のチャンスはまだ  1/3 のままか?説明せよ.

〔出典:T. H. Cormen, C. E. Leiserson, R. L. Rivest, C. Stein: Introduction to Algorithm (3rd Edition), MIT Press, 2009. (浅野哲夫, 岩野和生, 梅尾博司, 山下雅史, 和田幸一(訳)『アルゴリズムイントロダクション 第3版』近代科学社, 2013) 〕

問題について

モンティホール問題と同様に、一見してどっちが正しいのか分からなくなるような問である。

最初に正しい考え方を示して、その後に誤った考え方を示そう。

確率を議論するためには、起こり得るすべての結果の全体の集合である、標本空間  \Omega を定めねばならない。起こり得るすべての結果は、それぞれ(解放される囚人, 看守の情報)という二つ組で表現できるので、

 \Omega = \{(X,Y), (X,Z), (Y,Z), (Z,Y)\}

と表せる。いま、解放される囚人は同様に確からしいから、

 \mbox{Pr}(\{(X,Y), (X,Z)\}) = \mbox{Pr}(\{(Y,Z)\}) = \mbox{Pr}(\{(Z,Y)\})

が成立つ。 \mbox{Pr}(\Omega) = 1 であるから、これら三つの確率は  1/3 で等しい。さらに、看守が無作為の選択をすることに注意する。解放される囚人が  X であった場合は  Y Z も処刑されるので、看守は  X に伝える囚人として、  Y Z のうちどちらか一方を選択しなければならないが、問題の記述からこれは無作為であると仮定せざるを得ない。したがって、

 \mbox{Pr}(\{(X,Y)\}) = \mbox{Pr}(\{(X,Z)\})

が成立つ。ここで、 \mbox{Pr}(\{(X,Y), (X,Z)\}) = 1/3 であったから、これら二つの確率は  1/6 で等しい。以上をまとめると、次のようになる。

 \mbox{Pr}(\{(X,Y)\}) = \mbox{Pr}(\{(X,Z)\}) = 1/6,  \mbox{Pr}(\{(Y,Z)\}) = \mbox{Pr}(\{(Z,Y)\}) = 1/3.

求める確率は、「 A: 看守が  Y を伝える」もとで、「 B:  X が解放される」ような条件付確率  \mbox{Pr}(B\ |\ A) = \mbox{Pr}(A \cap B) / \mbox{Pr}(A) である。 A = \{(X,Y), (Z,Y)\},  B = \{(X,Y), (X,Z)\} であるので、

 \mbox{Pr}(B\ |\ A) = \mbox{Pr}(\{(X,Y)\}) / \mbox{Pr}(\{(X,Y), (Z,Y)\}) = (1/6)/(1/6+1/3) = \boldsymbol{1/3}.

つまり  X の解放される確率は看守の助言によって変化しない。さて、次のように考えるのはどうだろうか?

我々は「起こり得るすべての結果は、それぞれ(解放される囚人, 看守の情報)という二つ組で表現できる」として話を進めたが、結果として看守は 「 Y が処刑される」と言うのだから、結果を表すのに看守の情報はもはや必要なく、標本空間  \Omega \Omega = \{X, Z\} と考えてよい。解放される囚人は無作為に決定されるのだから、 \mbox{Pr}(\{X\}) = \mbox{Pr}(\{Z\}) であり、 \mbox{Pr}(\Omega) = 1 であるので  \mbox{Pr}(\{X\}) = 1/2 となるから、 X の考えは正しい。

この考え方は誤っている。看守が 「 Y が処刑される」と助言できるのは、解放される囚人を無作為に選んだ後にのみ可能であることに注意すると、この誤答では因果関係が逆転していることに気づくだろう。看守の助言は、解放される囚人の無作為な選択に依存して定まる。確率を定義するためには、それ以前に標本空間が与えられていることを前提とするので、これでは最初の「無作為に解放囚人を選ぶ」とき以前に標本空間が与えられていないことになって不合理を生ずる。つまり、「標本空間を定める」→「無作為に解放囚人を選ぶ」→「看守から助言を受ける」が正しい依存関係であるのに、「無作為に解放囚人を選ぶ」→「看守から助言を受ける」→「標本空間を定める」としてしまっているので意味がない。標本空間は過程の初めに定まっていなければならない。 これが確率の定義であり、このことを忘れると結果を誤りがちである。