きょうだいベイズ問題の答えは 2/3 ではない
ネット上でたびたび話題になる問題がある。
問題(1)
2人きょうだいの子供のうち、1人が男の子の場合、もう1人が女の子である確率はいくらか?
適当な名前がないので、いま私が「きょうだいベイズ問題」と名付けた。
ネット上の議論では答えは 2/3 だというのが定説になっている。
例えばこのサイト
http://taustation.com/conditional-probability-brother/
では「区別なしの場合」というセクションでこれを扱っており、2/3 としている。
最近つらつら考えて
2/3 は間違い。正解は 1/2 だ。
という結論に達した。2/3 派がどこをどう間違っているのかも判った。
「観点の違いであって 1/2 も 2/3 もどちらも正しい」という意見もちょくちょく見るが、あれも間違いである。
1/2 でしかありえない。
この件については「完全に理解した」と言っていいと思う。結論というか真理である。
そういうわけで頭の整理がてら記事にして、この知見を共有したい。
で、多くの人は「2/3 派はどう間違っているのか」という話に興味があると思うが、議論の都合上、先に 1/2 派の主張を紹介したい。
1/2 派の主張は大きく二つに分けられる。それぞれ A, B 説とする。
この A, B 説はたまたま結論が一致したというものではなく、二つとも議論の過程も正しい。
議論の過程が正しく、結論も正しい。つまり、世界と一致した真理である。
A 説
そもそも各妊娠・出産は独立の事象であり、男の子が生まれる確率と女の子が生まれる確率はそれぞれ 1/2 。
これは二人のペアがきょうだいだろうがそうで無かろうが成り立つ。
ゆえに件の問題の答えは 1/2 。
うん、完璧ですね。
B 説
二人の人間で一つのペアを作る場合、成立しうる性別の組み合わせの全パターンは次の三つである。
これは二人のペアがきょうだいのときでも勿論成立する。
表(1)
g | h | i |
---|---|---|
男 | 男 | 女 |
男 | 女 | 女 |
そもそも大前提として確率の問題はすべて
(求めたい特定の事象のパターン) / (成立しうる全パターン)
で求められる。
問題の条件から i(女, 女)の可能性は除外できる。
全パターンは g(男, 男)と h(男, 女)の2パターン。
そのうち特定の事象のパターンは h(男, 女)の1パターン。
ゆえに 1/2 。
マーヴェラス。
2/3 説
ここでは 2/3 派の主張を紹介し、それに反論して完全に退けようと思う。
だから 1/2 派の私はここでは自分から積極的に主張するものはない。
さて、2/3 派の人は B 説はおかしい、正しくはこうだと言って表を持ち出してくる。
こういうものだ。
表(2)
j | k | l | m |
---|---|---|---|
older | older | older | older |
男 | 男 | 女 | 女 |
男 | 女 | 男 | 女 |
younger | younger | younger | younger |
同じ(男, 女)のペアと言っても(兄, 妹)のペアと(姉, 弟)のペアは別物だろ?
というわけだ。
問題の条件からどちらも女性のペアである m は除外できる。
全パターンは j と k と l の3パターン。
そのうち特定の事象のパターンは k と l の2パターン。
ゆえに 2/3 。
なるほど。こういう表を持ち出されるとなかなかもっともらしく見える。
正面から反論するのは意外と面倒なので、ひとつ例題を出したい。
問題(2)
大きさも形も手触りも同じ、金貨と銀貨を一枚づつ、合計2枚用意する。
Charley はこの2枚のコインを同時に机に投げ、すぐにその上にベールを被せる。
最初から目隠しをされていた Delta が他の人の誘導のもとベールの下に手を入れ、そろそろと指を伸ばし、最初に触れた一枚のコインを引っ張り出す。
そのコインは表だった。
このときもう一枚のコインが裏である確率はいくらか?
さて、あなたはいま目隠しをされている Delta だと想像してほしい。
あなたは目隠しをされているので、自分が引いたコインが金貨か銀貨かは判らない。当然ベールの中のコインが金貨か銀貨かも判らない。
起こりうる全てのパターンはこうだ。
表(3)
n | o | p |
---|---|---|
表 | 表 | 裏 |
表 | 裏 | 裏 |
問題の条件から p(裏, 裏)は除外できる。
全パターンは n(表, 表)と o(表, 裏)の2パターン。
そのうちもう一枚のコインが裏なのは o(表, 裏)の1パターン。
答えは 1/2 。
ここで、この一連の流れを外から見ていた Echo に登場していただこう。
最初の3センテンスは省略する。
そのコインは金貨で表だった。
このときもう一枚のコインが裏である確率はいくらか?
地道に全パターンを列挙していこう。
図にするとこうだ。
表(4)
q | r | s | t |
---|---|---|---|
金貨 | 金貨 | 金貨 | 金貨 |
表 | 表 | 裏 | 裏 |
表 | 裏 | 表 | 裏 |
銀貨 | 銀貨 | 銀貨 | 銀貨 |
問題の条件から金貨が裏の s と t は除外できる。
全パターンは q と r の2パターン。
そのうちもう一枚のコインが裏なのは、r の1パターン。
答えは 1/2 。
ここまで読み進めてきた賢明なる読者諸君はお気づきだろう。
問題(2)は問題(1)の言い替えである。
older か younger かの区別をまとめて長幼属性、金貨か銀貨かの区別をまとめて色属性、男か女かの区別をまとめて性別属性とする。
問題(2)の色属性は問題(1)の長幼属性に、問題(2)の表か裏かは問題(1)の性別属性に対応する。
これで 2/3 派の誤りは明らかだと思う。
問題(1)の前半だけ引用する。
2人きょうだいの子供のうち、1人が男の子の場合(…)
この文章が意味するのは、問題(2)の Delta の視点か Echo の視点か、どちらだろうか。
性別属性と長幼属性は独立なので、性別属性を知らされても長幼属性については何も判らない。blind な状態である。
これは問題(2)の目隠しされた Delta の視点に対応する。
Delta の視点から見える全パターンは表(3)である。これは問題(1)だと表(1)に対応する。
そう、問題(2)の Delta が表(4)を導き出せないように、問題(1)から表(2)は絶対に導き出せないのだ。
これが 2/3 派の誤りである。
では、表(4)は何なのか。表(4)に対応する問題(1)の視点とはどういうものなのか。
表(4)を作った Echo は、コインが表か裏かを見ると必ずそのコインが金貨か銀貨かも判ってしまう。
逆に言えば、コインが金貨か銀貨かを知らずにそのコインが表か裏かを知ることはできない。
これは問題(1)に対応させれば、性別が判れば必ずその子が older か younger かも判ってしまうという状態だ。
そういう可能世界を想像することはできるが、この現実世界はそうなっていない。
問題(1)ではありえない表なのだ。
(しかも、先に見た通り、そういう可能世界でも表(4)から導き出される答えは 1/2 なのだ)
日本人は生まれたときから儒教イデオロギーにどっぷり浸かっているので、二人きょうだいで二人の性別が別のものだと、それが(兄, 妹)なのか(姉, 弟)なのかはっきり区別したがる。
「だって全然違うものじゃないか」というわけだ。
2/3 派はそこに付け込んでしれっと現実には存在しない表を持ち出し、我々を誑かしているのだ。
追記 :
続編書きました。
きょうだいベイズ問題(3) - ChieOsanai’s blog
きょうだいベイズ問題(4) - ChieOsanai’s blog