而して

ノートとかメモとか。

モンティホール問題

有名問題。

あなたはあるクイズショウの参加者である. 3つあるカーテンのうちの1つの後ろに賞品が隠されていて, 正しいカーテンを選べばこの賞品を獲得できる. あなたが1つのカーテンを選んだ後, そのカーテンを引き上げる前に司会者は残りのカーテンの中から1つを引き上げ, 空であることを示して, あなたに決心を変えるかどうか尋ねる. あなたが決心を変えたとき, あなたが賞品を得るチャンスは変わるか?

〔出典:T. H. Cormen, C. E. Leiserson, R. L. Rivest, C. Stein: Introduction to Algorithm (3rd Edition), MIT Press, 2009. (浅野哲夫, 岩野和生, 梅尾博司, 山下雅史, 和田幸一(訳)『アルゴリズムイントロダクション 第3版』近代科学社, 2013) 〕

問題について

多くの人が、「最終的に二択になるんだから単純に半々の確率では?」と思うようで、実際自分もそう思ったが、違うらしく、正解は 「選び直せば2/3、選び直さなければ1/3で当てることができる」という、直観にいくらか反したものである。具体的に計算すれば確かにその通りになる。詳しくは↓

mathtrain.jp

「ああ確かに」と納得してしまえばそれまでだが、もう少し考えてみた。正しい答は知ったが、なぜ間違えたのかという本質的な問題がしばらく解消できなかった。つまり、やはり直観による答も正しいように思えて、直観の何が正しく何が間違っているのかが判然としなかった。今日ずっと考えて、自分なりに整理できたような気がするので、まとめておきたい。

確率を定めるためには、起こり得るすべての結果を含む集合である標本空間  \Omega を表現しなければならない(これは当たり前のように聞こえるが、とても重要なことである)。このゲームの進み方は

①最初に無作為に選んだカーテンの番号

②司会者から教わった外れのカーテンの番号

③最後に選んだカーテンの番号

という三つの数の組合せで表現することができる。カーテンの番号を順に  0, 1, 2 番とする。例えば  (0,1,0) は、①最初に0番のカーテンを選び、②司会者から1番が外れだと教わり、③決心を変えずに0番を選んだ-という進行を表現するものとしよう。いま、このゲームで言う「正しいカーテン」が0番であると固定すると、進行の全体の集合  \Omega は次のようにかける:

 \Omega = \{(0,1,0), (0,1,2), (0,2,0), (0,2,1), (1,2,0), (1,2,1), (2,1,0), (2,1,2)\}.

ここが誤解だが、これらすべての結果が同確率で起こる(つまり、「同様に確からしい」)わけではないことに注意したい。「同様に確からしい」という概念は、無作為に選んだ結果に仮定できる条件である。我々は①で、最初の番号を無作為に選んでいるので、

 \mbox{Pr}(\{(0,1,0), (0,1,2), (0,2,0), (0,2,1)\})  = \mbox{Pr}(\{(1,2,0), (1,2,1)\}) = \mbox{Pr}(\{(2,1,0), (2,1,2)\})

を結論づけることはできる。しかし、

 \mbox{Pr}(\{(0,1,0)\}) = \mbox{Pr}(\{(0,1,2)\}) = \mbox{Pr}(\{(0,2,0)\})  = \mbox{Pr}(\{(0,2,1)\}) = \mbox{Pr}(\{(1,2,0)\}) = \mbox{Pr}(\{(1,2,1)\})  = \mbox{Pr}(\{(2,1,0)\}) = \mbox{Pr}(\{(2,1,2)\})

というように、すべての結果が同確率で起こると仮定するには根拠がない。とはいえ、「根拠がない」と一蹴して終わるのも味気ないので、実際にこの仮定の下で話を進めて、間違っていることを見てみよう。確率の性質によって、 \mbox{Pr}(\Omega) = 1 であり、部分集合  A, B \subseteqq \Omega について  A \cap B = \emptyset ならば  \mbox{Pr}(A\cup B) = \mbox{Pr}(A) + \mbox{Pr}(B) が成立つことを用いると、

 \mbox{Pr}(\Omega) =  \mbox{Pr}(\{(0,1,0)\}) + \mbox{Pr}(\{(0,1,2)\}) + \mbox{Pr}(\{(0,2,0)\})  + \mbox{Pr}(\{(0,2,1)\}) + \mbox{Pr}(\{(1,2,0)\}) + \mbox{Pr}(\{(1,2,1)\})  + \mbox{Pr}(\{(2,1,0)\}) + \mbox{Pr}(\{(2,1,2)\})  = 1

であって、すべての結果が同確率で起こるという仮定から、すべての結果は確率  1/8 で起こることが分かる。すると、番号を変えて当たる確率は

 \mbox{Pr}(\{(1,2,0), (2,1,0)\}) = 1/8 + 1/8 = 1/4

であり、番号を変えずに当たる確率も

 \mbox{Pr}(\{(0,1,0), (0,2,0)\}) = 1/8 + 1/8 = 1/4

となって、番号を変えようが変えまいが同じ確率になって、正しい答が得られていないのが分かる。

本題に戻る。先のことから、

 \mbox{Pr}(\{(0,1,0), (0,1,2), (0,2,0), (0,2,1)\})  = \mbox{Pr}(\{(1,2,0), (1,2,1)\}) = \mbox{Pr}(\{(2,1,0), (2,1,2)\})

は成立つのだった。 \mbox{Pr}(\Omega) = 1 だから、これら三つの確率は  1/3 で等しいことが分かる。ここで、司会者も無作為の選択をしていることに注意する。挑戦者が見事①で正解  0 を選んだ場合、司会者が空ける外れのカーテンの番号の候補は二つあり、問題の仮定から、司会者はこの二つから空けるカーテンの番号を同確率で選ぶと考えざるを得ない。したがって、①で0が選ばれた場合に、②で選ばれる進行は同様に確からしい。ゆえに、

 \mbox{Pr}(\{(0,1,0), (0,1,2)\}) = \mbox{Pr}(\{(0,2,0), (0,2,1)\})

が成立つので、 \mbox{Pr}(\{(0,1,0), (0,1,2), (0,2,0), (0,2,1)\}) = 1/3 であることから、これら二つの確率は  1/6 で等しい。得られた結果を整理すると、次のようになる。

 \mbox{Pr}(\{(0,1,0), (0,1,2)\}) = 1/6,

 \mbox{Pr}(\{(0,2,0), (0,2,1)\}) = 1/6,

 \mbox{Pr}(\{(1,2,0), (1,2,1)\}) = 1/3,

 \mbox{Pr}(\{(2,1,0), (2,1,2)\}) = 1/3.

番号を変える場合と変えない場合で、当たる確率と外れる確率をそれぞれ求めよう。

番号を変える場合 \mbox{Pr}(\{(0,1,0)\}) = \mbox{Pr}(\{(0,2,0)\})  = \mbox{Pr}(\{(1,2,1)\}) = \mbox{Pr}(\{(2,1,2)\}) = 0 が得られるから、

 \mbox{Pr}(\{(0,1,2)\}) = 1/6,  \mbox{Pr}(\{(0,2,1)\}) = 1/6,

 \mbox{Pr}(\{(1,2,0)\}) = 1/3,  \mbox{Pr}(\{(2,1,0)\}) = 1/3.

従って、「変えて当たる確率」は  \mbox{Pr}(\{(1,2,0), (2,1,0)\}) = \boldsymbol{2/3} で、「変えて外れる確率」は  \mbox{Pr}(\{(0,1,2), (0,2,1)\}) = 1/3 となる。

番号を変えない場合 \mbox{Pr}(\{(0,1,2)\}) = \mbox{Pr}(\{(0,2,1)\})  = \mbox{Pr}(\{(1,2,0)\}) = \mbox{Pr}(\{(2,1,0)\}) = 0 が得られるから、

 \mbox{Pr}(\{(0,1,0)\}) = 1/6,  \mbox{Pr}(\{(0,2,0)\}) = 1/6,

 \mbox{Pr}(\{(1,2,1)\}) = 1/3,  \mbox{Pr}(\{(2,1,2)\}) = 1/3.

従って、「変えないで当たる確率」は  \mbox{Pr}(\{(0,1,0), (0,2,0)\}) = \boldsymbol{1/3} で、「変えないで外れる確率」は  \mbox{Pr}(\{(1,2,1), (2,1,2)\}) = 2/3 となる。

司会者の闖入により、最後の③で「決心を変える」「決心を変えない」という二択を迫られるので、「 1/2では?」と思ってしまいがちだが、これは考えている標本空間を取り違えてしまっていることに起因する誤りである。詳しくは三囚人問題を参照のこと。