Loading AI tools
パラドックスと看做されることが多い確率論の問題 ウィキペディアから
モンティ・ホール問題(モンティ・ホールもんだい、英: Monty Hall problem)とは、確率論の問題で、ベイズの定理における事後確率、あるいは主観確率の例題の一つとなっている。モンティ・ホール(Monty Hall, 本名:Monte Halperin)が司会者を務めるアメリカのゲームショー番組、「Let's make a deal[注釈 1]」の中で行われたゲームに関する論争に由来する。一種の心理トリックになっており、確率論から導かれる結果を説明されても、なお納得しない者が少なくないことから、モンティ・ホール・ジレンマ、モンティ・ホール・パラドックスとも称される。「直感で正しいと思える解答と、論理的に正しい解答が異なる問題」の適例とされる。
「 |
<投稿された相談> ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。 |
」 |
1990年9月9日発行、ニュース雑誌「Parade」にてマリリン・ヴォス・サヴァントが連載するコラム「マリリンにおまかせ」で、上記の読者投稿による質問に「正解は『ドアを変更する』である。なぜなら、ドアを変更した場合には景品を当てる確率が2倍になるからだ」と回答。すると直後から、読者からの「彼女の解答は間違っている」との約1万通の投書が殺到し、本問題は大議論に発展した。
投書には、1000人近い博士号保持者からのものも含まれていた。その大部分は「ドアを変えても確率は五分五分(2分の1)であり、3分の2にはならない」とするものであった。サヴァントは投書への反論を試み、同年12月2日、数通の反論の手紙を紹介した。
サヴァントは、より簡易にした表を掲載「ドアを変えれば勝てるのは3回の内2回、負けるのは3回の内1回だけ、しかしドアを変えなければ勝てるのは3回の内1回だけ」と述べる。この問題に関する1991年2月17日付、3回目の記事の段階でサヴァントに対する反論は9割程度を占める。
「現実が直観と反する時、人々は動揺する」とサヴァントはコラムで反論の声に応じ、下記の説明を試みる。
「 | 司会者がドアを開けてみせた直後にUFOがステージに到着して宇宙人が出てきたと仮定する。人間の出場者が最初に選んだ扉を宇宙人は知らずに司会者がまだ開けられていない2つの扉のどちらかを選択するよう宇宙人に勧めると、この時の確率が五分五分になる。しかし、それは宇宙人が本来の出場者が司会者から得たヒントを知らないためである。仮に景品が扉2にある場合司会者は扉3を開ける。扉3に景品がある場合は扉2を開ける。つまり景品が扉2または扉3にあるなら、出場者が扉の選択を変えれば勝利する。『どちらかでも勝てるのです!』でも扉を変えなければ、扉1に賞品がある場合しか勝てないのです。 | 」 |
サヴァントの再再々解説でも大論争へと発展、「彼女こそ間違っている」という感情的なジェンダー問題にまで飛び火した。
プロ数学者ポール・エルデシュの弟子だったアンドリュー・ヴァージョニが本問題を自前のパーソナルコンピュータでモンテカルロ法を用いて数百回のシミュレーションを行うと、結果はサヴァントの答えと一致。エルデシュは「あり得ない」と主張していたがヴァージョニがコンピュータで弾き出した答えを見せられサヴァントが正しかったと認める[1]。その後、カール・セーガンら著名人らがモンティーホール問題を解説、サヴァントの答えに反論を行なっていた人々は、誤りを認める。
サヴァントは、「最も高い知能指数を有する者が、子供でもわかる些細な間違いを新聞で晒した」等の数多くの非難に対して3回のコラムをこの問題にあて、激しい反論の攻撃に耐えて持論を擁護し通し、証明した[2]。それによると、ドアの数を100万に増やした例まで挙げて説明しても正しく理解してもらえなかったとのことである。
なお、サヴァントの本の183頁以降に、ミズーリ大学のドナルド・グランバーグ教授が補遺を記載している。それによると、モンティ・ホールジレンマに関しては、コラムでの議論ののちに、「アメリカン・スタティスティシャン」「アメリカン・マスマティカル・マンスリー」「マスマティカル・サイエンティスト」「マスマティクス・ティーチャー」「ニューヨークタイムズ」等の媒体で細部まで議論され、その結果、サヴァントの解答は基本的に正しいとされたとのことである[3]。
このうち (3) と (4) の条件が重要である(ベイズの定理でいう事後確率が有効になる)。 もし (3) が決められていなければ、例えば開けるかどうかモンティが決められるなら、このゲームはプレーヤーとモンティの心理戦であり、確率の問題ではない。 また、(4) の条件次第では答えが逆になったり、答えを定めることができなかったりする。つまり、モンティが景品を出してしまう可能性があるなら、問題の大前提が変わってしまう。
大騒ぎとなった最大の原因として、ルールに対する数学的な説明が無く「解釈」の余地があったことで、数学的に正しいルールが決まるまで決着が付かなかった[要出典]。
この問題を巡る人々の反応は、冒頭のエピソードにある様に『どちらを選んでも変わらない』とする意見が多かった。
ドアが2つになった時点でプレーヤーが改めてコイントスによって決めなおしたと仮定すると、景品を得る確率はコイントスから生じる確率1/2そのものとなる(それまでの確率 1/3 と 2/3 との選択を止めることになるため)。
ところが、2枚のドアの価値はルール (1) - (4) で確率の高い(価値のある)選択をすることが可能となっている。つまり、『どちらを選んでも変わらない』は誤りである。
以下のように考えると直感でも理解しやすい。
最初の選択 / 残りのドアの中身 (位置は考えなくてよい) ↓ ↓ A 当たり / ハズレ (青) ・ ハズレ (赤) B ハズレ (青) / 当たり ・ ハズレ (赤) C ハズレ (赤) / 当たり ・ ハズレ (青)
最初にハズレのドアを選ぶことができれば、上記手順で確実に当たりのドアを開けることができる。最初にハズレのドアを選ぶことができる確率は2/3であるので、この手順に従えば(つまりドアを変更すれば)2/3の確率で当たりのドアを開けることができる。
この1.の「当たりのドアを選ぶ」か「ハズレのドアを選ぶ」かは気持ちの問題であり、確率的な影響はまったくないことに注意を要する。3.でドアを変更することへの抵抗感をなくす効果しか持っていない。
よって2.においてモンティが「もう一つのハズレのドアがどれかを教えてくれる」のではなくモンティも当てようとする(モンティが当てたらプレーヤーは自動的に外れる)場合には、1/3の確率で2.でモンティが当ててしまうので、3.にたどり着くのはモンティが2/3の確率で外した場合に限る。この場合3.にたどり着いた時点で残る確率は、変更すると当たる確率1/3(2/3だった確率のうち1/3をモンティが使って(そして外して)しまった)と、変更すると外れる確率1/3とになり、ドアを変更してもしなくても確率は等しいという直感通りの確率になる。
つまり、2.でモンティが2/3の確率のうち1/3を使ってハズレのドアを開けてしまうのではなく、確実に(確率を減らさずに)ハズレのドアを開けることが直感通りにならない要因である。
これを変形させた考え方もできる。
最初にプレーヤーが選んだ1枚のドアと「残り99枚のうちで、正解を知っているモンティが開こうとしなかった、ただ1枚のドア」の確率が相違していることは、直感で理解が可能であろう。
または、こう考えることもできる。
プレーヤーが最初に選択することにより、ひとまとめの対象から(番組側から見てランダムに)外されたドアと、残りすべてのドアでは、価値が等しくないことは明らかである。
この問題はパラドックスであるといわれることがある。最初からドアが1つ開いた状態で、2つのドアから1つを選ぶという問題であったなら、確率は 1/2 である。それに対して、このゲームによってドアが1つ開いた状態になった場合には、確率は 1/3 と 2/3 になる。このように確率が異なることがパラドックスといわれる理由である。 (これに似た問題として2人の子供の性別問題がある。)
しかし、これは確率の計算に矛盾があるわけではないので、擬似パラドックスである。ドアが2択になった経緯を知っているか知らないかの情報の差がドアの評価に影響しているだけである(単純な話、「最初にプレーヤーがドアを選択する時点での確率」と考えると理解しやすい。なお、1つドアが初めから開いた状態=単なる2択問題であり、モンティ・ホール問題は成立し得ない)。
自然な仮定の下で、開けるドアを変更すると、プレーヤーが景品を獲得する確率が2倍になることをベイズの公式(ベイズの定理)を使って示す。
簡単化のため、プレーヤーは初めにAのドアを選ぶものとする(プレーヤーが初めにBまたはCのドアを選ぶとしても以下の論法は変わらない)。
標本空間をΩとし(例えば、全ての放映されたモンティ・ホール・ショーのうち、プレーヤーが初めにAのドアを選んだ場合全ての集合と考えることにする)、Ω上で定義された確率をPとする(ここでは、Ωの任意の部分集合Uに対して、P(U)=(Uの要素の個数)/(Ωの要素の個数)と定義することにする)。また、Ω上で定義された「景品があるドア」を表す確率変数をXとし、「モンティが開けるドア」を表す確率変数をYする。XとYの値域は、それぞれ、X(Ω)={A,B,C}、Y(Ω)={A,B,C}である。xをX(Ω)の要素を表す変数とすれば(つまりxはA,B,Cのいずれかの値を取る)、「景品があるドア」がxである確率はPX(x)=P(X-1(x))と表される。同様に、yをY(Ω)の要素を表す変数とすれば、「モンティが開けるドア」がyである確率はPY(y)=P(Y-1(y))と表される。
プレーヤーが初めにAのドアを選び、モンティがBかCのドアを開ける前の時点での結合確率PX,Y(x,y)=P(X-1(x)∩Y-1(y))を考える。ベイズの公式により、条件付確率PX|Y(x|y)=PX,Y(x,y)/PY(y)、および条件付確率PY|X(y|x)=PX,Y(x,y)/PX(x)である。
ここで自然ではあるが、問題文では触れられていない次の仮定を置く。「景品がAのドアにある場合、モンティがBのドアまたはCのドアを選ぶ確率は等しく1/2である」。この仮定が成り立たない場合については後で考察する。
プレーヤーの持っている情報では、景品がA,B,Cのどのドアにあるかの確率は等しく1/3である。つまりPX(A)=PX(B)=PX(C)=1/3である。プレーヤーがAのドアを選んだ場合、モンティはAのドアを開くことは無いので、条件付確率PY|X(A|A)=PY|X(A|B)=PY|X(A|C)=0 である。従ってPX,Y(A,A)=PX,Y(B,A)=PX,Y(C,A)=0 である。景品がAのドアにある場合、モンティがBのドアを選ぶ条件付確率PY|X(B|A)は、上の仮定により1/2であり、ベイズの公式から結合確率PX,Y(A,B)=PY|X(B|A)×PY(A)=1/6となる。モンティがCのドアを選ぶ結合確率PX,Y(A,C)も同様に1/6である。
景品がBのドアにある場合、モンティはAとBのドアを選ぶことはできないのでCのドアを開けざるを得ない。つまりPY|X(B|B)=0であり、PY|X(C|B)=1である。従ってPX,Y(B,B)=PY|X(B|B)×PX(B)=0であり、PX,Y(B,C)=PY|X(C|B)×PX(B)=1/3である。同様に、PX,Y(C,C)=0であり、PX,Y(C,B)=1/3である。
以上を表にまとめると、次のようになる。
結合確率PX,Y(x,y)= P(X-1(x)∩Y-1(y)) |
確率変数Y (モンティが開けるドア) |
PX(x)= P(X-1(x)) | |||
---|---|---|---|---|---|
y=A | y=B | y=C | |||
確率変数X (景品があるドア) |
x=A | 0 | 1/6 | 1/6 | 1/3 |
x=B | 0 | 0 | 1/3 | 1/3 | |
x=C | 0 | 1/3 | 0 | 1/3 | |
PY(y)= P(Y-1(y)) |
0 | 1/2 | 1/2 | P(Ω)=1 (全確率) |
表からわかるように、プレーヤーの持っている情報では、モンティがBのドアを開ける確率PY(B)またはCのドアを開ける確率PY(C)は等しく1/2である。 モンティがCのドアを開けた瞬間、プレーヤーの持っている情報は、条件付確率PX|Y(x|C)となる。ベイズの公式によりPX|Y(x|C)=PX,Y(x,C)/PY(C)であるから、PX|Y(A|C)=1/3、PX|Y(B|C)=2/3、PX|Y(C|C)=0となる。つまり、景品がAのドアにある確率は1/3であり、Bのドアにある確率は2/3である。従って確かに、プレーヤーが開けるドアをAからBに変更すれば、景品を獲得する確率は2倍になる。モンティがBのドアを開けた場合も全く同様になる。
以下で、上記の仮定「景品がAのドアにある場合、モンティがBのドアまたはCのドアを選ぶ確率は等しく1/2である」が成り立たない場合について考察する。景品がAのドアにある場合、モンティがBのドアを選ぶ確率をr (0≤r≤1)、Cのドアを選ぶ確率を1-rとする。つまりPY|X(B|A)=r、PY|X(C|A)=1-rとする。
この場合の、結合確率PX,Y(x,y)は下表のようになる。r=1/2であれば上の表に一致する。
結合確率PX,Y(x,y)= P(X-1(x)∩Y-1(y)) |
確率変数Y (モンティが開けるドア) |
PX(x)= P(X-1(x)) | |||
---|---|---|---|---|---|
y=A | y=B | y=C | |||
確率変数X (景品があるドア) |
x=A | 0 | r/3 | (1-r)/3 | 1/3 |
x=B | 0 | 0 | 1/3 | 1/3 | |
x=C | 0 | 1/3 | 0 | 1/3 | |
PY(y)= P(Y-1(y)) |
0 | (1+r)/3 | (2-r)/3 | P(Ω)=1 (全確率) |
この場合、もしモンティがBのドアを開けた場合には、その瞬間に、各ドアに景品のある確率は、ベイズの公式によりPX|Y(A|B)=r/(1+r)、PX|Y(B|B)=0、PX|Y(C|B)=1/(1+r)に変化する。
逆に、もしモンティがCのドアを開けた場合には、その瞬間に、各ドアに景品のある確率は、ベイズの公式によりPX|Y(A|C)=(1-r)/(2-r)、PX|Y(B|C)=1/(2-r)、PX|Y(C|C)=0に変化する。
さらに具体的に、「プレーヤーがAのドアを選んだ状態で、景品がAのドアにある場合、モンティは必ずCのドアを選ぶ」、つまりr=0という情報をプレーヤーが持っている場合(例えば今まで放映された番組では、必ずそうしていたという情報を持っているような場合)について考えてみる。
この場合、もしモンティがBのドアを開けた場合には、その瞬間に、各ドアに景品のある確率は、上の式に r=0 を代入して PX|Y(A|B)=0、PX|Y(B|B)=0、PX|Y(C|B)=1に変化し、景品がCのドアにあることが確定する。
逆に、もしモンティがCのドアを開けた場合には、その瞬間に、各ドアに景品のある確率は、やはり上の式に r=0 を代入して PX|Y(A|C)=1/2、PX|Y(B|C)=1/2、PX|Y(C|C)=0に変化する。この場合は「ドアを変えても確率は五分五分(2分の1)であり、3分の2にはならない」というクレームは正しいことになる。
一方、r=0 の場合、モンティがBのドアを開ける確率は1/3であり、Cのドアを開ける確率は2/3である。プレーヤーが、どのような場合でもドアを変えるという戦略を採る場合の景品を得る確率は、1/3×1+2/3×1/2=1/3+1/3=2/3であり、r=1/2 の場合と変わらないことが分かる。
次に、r が一般の値 (0≤r≤1) であり、プレーヤーは r の値を知っていて、モンティが選択するドアに応じて、最も景品を得る確率が高いドアを選択する場合を考える。
この場合、モンティがBのドアを開けた場合には、Cのドアに景品がある条件付確率PX|Y(C|B)は1/(1+r)、Aのドアに景品がある条件付確率PX|Y(C|B)はr/(1+r)であるから、Cのドアに景品がある確率のほうが大きいか(r<1 の場合)、または等しい(r=1 の場合)。
逆に、モンティがCのドアを開けた場合には、Bのドアに景品がある条件付確率PX|Y(B|C)は1/(2-r)、Aのドアに景品がある条件付確率PX|Y(A|C)は(1-r)/(2-r)であるから、Bのドアに景品がある確率のほうが大きいか(r>0 の場合)、または等しい(r=0 の場合)。
結局、モンティがBまたはCのどちらのドアを選んだ場合でも、プレーヤーがAとは別の残りのドアを選んだ方が、選択をAのドアのまま変えない場合より景品を得る確率は高いか等しくなる。
これらの場合、モンティがBのドアを選ぶ確率は、上表から(1+r)/3であり、Cのドアを選ぶ確率は、(2-r)/3である。従って、モンティがBまたはCのどちらのドアを選ぶにしても、プレーヤーはAとは別の残りのドアを選ぶという戦略を採る場合に景品を得られる確率は、(1+r)/3×1/(1+r)+(2-r)/3×1/(2-/r)=1/3+1/3=2/3であり、これはrの値に関係なく成立することが分かる。
つまり、モンティがドアの選択について、どのような傾向を持っているかという情報を、プレーヤーが持っているか、いないかにかかわらず、プレーヤーはドアの選択を変更する戦略を採る方が、景品を得る確率は高くなり、その場合に景品を得られる確率は、モンティのドア選択の傾向(r の値)に関係なく2/3であることが分かる。
簡単なプログラムでシミュレーションを行い、答えを導くこともできる(図)。このグラフでは、変更したドアに景品があった回数の累計が、変更しなかった場合の約2倍となっている。
ルールを変更することで例題の理解を助けたり、統計論の別の課題を説明する試みが行われている。
(4) モンティは景品のあるドアを知っている。どちらを開けるかコイントスで決めるが、選んだドアが景品の場合はもう片方のドアに変更する。
このルールは結局ドアの選び方に変化はないので、解答は「開けるドアを変更する」である。
(4) モンティは景品のあるドアを知らない。どちらを開けるかコイントスで決めるが、選んだドアが景品の場合は番組スタッフが中身を入れ替える。
これは、前のルールで最後にモンティがドアの選択を変更していたところをスタッフが代わりにやっているだけであり、解答は「開けるドアを変更する」である。
このルールではドアを変更したほうがよいことが直感的に分かる。残ったドアに景品が移動してくることはあっても、出ていくことはないからである。数値で示すと、プレーヤーが最初から正解していた確率は 1/3、モンティが正解して景品が移動した確率も 1/3、二人ともハズレであった確率も 1/3 である。景品は必ず最後の扉に移動するので、最後の扉に景品がある確率は 2/3 である。
(4) モンティはどちらを開けるかコイントスで決め、中身にかかわらず開ける。
モンティが景品を出してしまった場合はゲーム終了と仮定して、モンティがヤギを出したらプレーヤーはドアを変更すべきだろうか?この場合の正解はどっちを選んでも確率は 1/2 となり、変更してもしなくてもよいのである。
モンティが景品を出す確率は1/3、ヤギを出す確率は 2/3 である。景品を出したらゲームは終了するので、ヤギを出した場合の2/3の内訳を考えると、プレーヤーが選んだドアに景品がある確率1/3と、最後のドアにある確率1/3になる。 この場合、プレーヤーもモンティも正解に関係なくドアを選ぶので、先に景品を入れる必要はなく、後から景品の位置をランダムに決めても結果は等価となる。
(3) モンティは景品のあるドアを知っている。コイントスでヤギのドアの片方を選び、プレーヤーの選択にかかわらず開ける。
モンティがプレーヤーの選んだドアを選んだ場合はゲーム終了と仮定して、モンティがヤギを出したらプレーヤーはドアを変更すべきだろうか?この場合も変更ルール3同様、変更してもしなくてもよいのである。
(3) モンティは景品のあるドアを知っている。最初にプレーヤーが景品のあるドアを選んだ時に限り、ドアを開ける。
このように変更すると、モンティがドアを開けない場合がある。もし、偶然にもモンティがドアを開けたとすると、プレーヤーはドアを変更すべきだろうか?この場合は当然答えは「開けるドアを変更しない」である。 このことから、モンティがドアを必ず開けるというルールは非常に重要だということが分かる。
(5) モンティは景品のあるドアを知っていて、プレーヤーが景品のあるドアを選んだ時だけ、変更してよいという[6]。
(5) モンティは景品のあるドアを知っていて、プレーヤーがヤギのいるドアを選んだ時だけ、変更してよいという[6]。
プレーヤーとモンティの心理戦を想定した例題も試みられている。駆け引きの内容を数値化することで、統計論的に解を求めることができる。
(5) モンティは景品のあるドアを知っていて、プレーヤーが景品のあるドアを選んだ時は100%の確率で、ヤギのいるドアを選んだ時は50%の確率で、プレーヤーが選ばなかったヤギのいるドアを開けて見せ、変更してよいという。
もとの例題ではルール (3) と (4) が重要とされるのが一般的だが、実はもう一つ重要な前提がある。それは、「プレーヤーが最初に当たりを選んだ場合に、モンティが残るドアのどちらを開けるかについて "癖がない(ランダムに選ぶ)" ことだ。例えば「プレーヤーが最初に当たりのAのドアを選んだ場合は、モンティは必ずBを開く」という可能性があるとすれば、「マリリンの解答は間違っている」というのは必ずしも間違いではない。ここで、「癖がない(ランダムに選ぶ)」ことがいかに重要であるか、具体的に説明する。
プレーヤーがドアAを選んだ場合にモンティがドアBを選択する(選択して開ける)確率を x とすると、ドアBが開いた(もちろん外れ)という条件のもとで、ドアAが当たりである確率は x/(1+x)となる(もちろん、ドアCが当たりである確率は 1/(1+x)である)。
計算法
ドアBが開いたということは、プレーヤーがドアCを選択したかドアAを選択したということである。ドアCを選択した場合は必ず(確率1で)ドアBを開き、ドアAを選択した場合は、確率 x でドアBを開くのであるから、ドアBが開いたという条件で、ドアAが当たりである確率は、xを1+x で割れば求められる。
よって、確率 x が0超1以下の間の数値を取るとすれば、ドアAが当たりである確率は0から1/2まで変化する(ドアCが当たりである確率は1から1/2まで変化する)。ドアB、Cをランダムに(x=1/2 の確率で)選択したときに限って、ドアAが当たりの確率は1/3のまま(ドアCが当たりの確率は当初の1/3から2/3に上がる)となる。マリリンの答えは、この特殊な条件を想定したものである。確かに常識的仮定だが、数学的には当然視できるものではない。
なお、先に述べた通り、x が0超1以下の間の数値を取るとき、ドアAが当たりである確率は0から1/2まで変化する一方、ドアCが当たりである確率は1から1/2まで変化する。よって、この前提の場合には、0<x<1のときはドアを変えたほうが当たる確率が高く、x=1のときはドアを変えても当たり確率に変化はないということになり、「ドアを変えたほうが良い」という結論は維持される。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.