男の子か女の子かのパラドックスは、確率論における一連の問題にまつわる問題であり、これらは「二人っ子問題」[ 1 ] 、「スミス氏の子供たち」[ 2 ]、「スミス夫人問題」としても知られています。この問題が初めて提起されたのは、少なくとも1959年、 マーティン・ガードナーが1959年10月の『サイエンティフィック・アメリカン』 誌の「数学ゲーム」コラムでこの問題を取り上げたときまで遡ります。彼はこの問題を「二人っ子問題」と題し、パラドックスを次のように表現しました。
ガードナーは当初、答えを出した。1/2と1/3とそれぞれ答えたが、後に2番目の質問は曖昧であったことを認めた。[ 1 ]その答えは次のようになるだろう。1/2、「少なくとも1人は男の子である」という情報がどのようにして得られたかによって、その曖昧さは変化する。この曖昧さは、正確な表現や想定される仮定によって変化するが、マヤ・バーヒレルとルマ・フォーク[ 3 ]、そしてレイモンド・S・ニッカーソン[ 4 ]によって確認されている。
この質問の他のバリエーションは、さまざまな程度の曖昧さを伴い、パレードマガジンのAsk Marilyn、[ 5 ] 、ニューヨークタイムズのジョン・ティアニー、[ 6 ]、The Drunkard's Walkのレナード・ムロディノフ[ 7 ]によって普及しました。ある科学的研究によると、同一の情報が伝えられたが、異なる点を強調する異なる部分的に曖昧な言葉遣いで伝えられた場合、次のように答えたMBA学生の割合は、1/2 85%から39%に変化した。[ 2 ]
このパラドックスは多くの論争を巻き起こした。[ 4 ]このパラドックスは、2つの質問の問題設定が似ているかどうかに起因している。[ 2 ] [ 7 ]直感的な答えは、1/2 . [ 2 ]この答えは、読者が質問から、2番目の子供の性別には2つの可能性(つまり、男の子と女の子)が同等にあり、[ 2 ]これらの結果の確率は条件付きではなく絶対的であると信じるように導く場合、直感的です。[ 8 ]

まず、すべての可能なイベントの空間は簡単に列挙でき、結果の外延的な定義{BB、BG、GB、GG}が与えられると仮定する。[ 9 ]この表記は、男の子をB、女の子をGとラベル付けし、最初の文字を年長の子供を表すものとして、子供の組み合わせが4つあることを示している。次に、これらの結果は等確率であると仮定する。[ 9 ]これは、p = のベルヌーイ過程である次のモデルを意味する。1/2 :
前述の仮定の下、この問題ではランダムに1つのファミリーが選択されます。この標本空間には、等確率で発生する4つの事象が存在します。
| 年長児 | 下の子 |
|---|---|
| 女の子 | 女の子 |
| 女の子 | 男の子 |
これらの可能性のある事象のうち、質問で指定された基準を満たすのは2つだけです(つまり、GG、GB)。新しい標本空間{GG、GB}における2つの可能性はどちらも等確率であり、そのうちGGのみに2人の女子が含まれているため、下の子も女子である確率は1/2。
この問題は問1と同じですが、上の子が女の子であると明記されている代わりに、少なくとも1人は男の子であると明記されています。1959年に出されたこの問題に対する読者からの批判に対し、ガードナーは、提供されていない情報がなければ解答は不可能であると述べました。具体的には、「少なくとも1人は男の子」と判断する2つの異なる手順によって、全く同じ問題の文言が導き出される可能性があるということです。しかし、それぞれ異なる正解が導き出されます。
グリンステッドとスネルは、ガードナーとほぼ同様に、この問題は曖昧であると主張している。[ 10 ]彼らは、1/3という答えを出す手順が、上記の問題に対して妥当であるかどうかを読者に判断させる。彼らが具体的に検討していた問題の定式化は以下の通りである。
この定式化には、曖昧さが最も顕著に表れています。特定の子供が男の子であると仮定して、他の子供については不確かなままにしておくべきなのか、それとも「少なくとも1人の男の子」と同じように解釈すべきなのかが明確ではないからです。この曖昧さによって、同等ではない複数の可能性が生じ、Bar-HillelとFalkが主張するように、情報がどのように得られたかについて仮定を立てる必要が生じます。異なる仮定は異なる結果につながる可能性があります(問題の記述が十分に定義されておらず、単一のわかりやすい解釈と答えを許すことができないため)。
例えば、観察者がスミス氏が子供のうち一人と散歩しているのを見たとします。もし彼に男の子が二人いるなら、その子供は男の子でなければなりません。しかし、男の子と女の子が一人ずついるなら、その子供は女の子だった可能性があります。つまり、彼が男の子と一緒にいるのを見ることで、女の子が二人いるという組み合わせだけでなく、息子と娘がいるという組み合わせも排除され、一緒に散歩する子供として娘を選ぶことになります。
したがって、スミス氏には必ず少なくとも一人の男の子がいる(つまり、条件は必要条件である)ことは確かに真実であるが、少なくとも一人の男の子がいるスミス氏を全て想定するとは仮定できない。つまり、問題文は、男の子がいることが、このようにスミス氏が男の子を持っていると特定されるための十分条件であるとは述べていない。
ガードナーのこの問題について、バー=ヒレルとフォーク[ 3 ]は、「スミス氏は読者とは異なり、この発言をする際にはおそらく自分の子供の性別を知っている」と指摘している。つまり、「私には子供が二人いて、少なくとも一人は男の子だ」ということである。さらに、もしこれが真実ならば、スミス氏は必ずこの事実を報告し、沈黙を守るか、少なくとも一人の娘がいると答えると仮定しなければならない。そうであれば、正解は1/3ガードナーが当初意図していたように。しかし、その仮定の下では、彼が沈黙を守るか、娘がいると言う場合、彼には娘が2人いる可能性が100%ある。
この情報が、二人の子どものうち少なくとも一人は男の子がいるかどうかを確認するために得られたと仮定すると、この条件は必要かつ十分条件となります。上記の標本空間において、二人っ子の家族に等確率で発生する4つの事象のうち、次の表に示すように3つがこの条件を満たしています。
| 年長児 | 下の子 |
|---|---|
| 女の子 | 男の子 |
| 男の子 | 女の子 |
| 男の子 | 男の子 |
したがって、男の子を探す際に両方の子供が考慮されたと仮定すると、質問2の答えは1/3しかし、最初に家族が選択され、次にその家族の1人の子供の性別についてランダムに真の発言がなされた場合、両方の性別が考慮されたかどうかにかかわらず、条件付き確率を計算する正しい方法は、その性別の子供を含むすべてのケースを数えることではありません。代わりに、各ケースで発言がなされる確率のみを考慮する必要があります。[ 10 ]したがって、ALOBが「少なくとも1人の男の子」という発言が行われるイベントを表し、ALOGが「少なくとも1人の女の子」という発言が行われるイベントを表す場合、次の表は標本空間を表します。
| 年長児 | 下の子 | P(この家族) | P(このファミリーを与えられたALOB) | P(ALOG、このファミリーの場合) | P(ALOBとこのファミリー) | P(ALOGとこのファミリー) |
|---|---|---|---|---|---|---|
| 女の子 | 女の子 | 1/4 | 0 | 1 | 0 | 1/4 |
| 女の子 | 男の子 | 1/4 | 1/2 | 1/2 | 1/8 | 1/8 |
| 男の子 | 女の子 | 1/4 | 1/2 | 1/2 | 1/8 | 1/8 |
| 男の子 | 男の子 | 1/4 | 1 | 0 | 1/4 | 0 |
したがって、ランダムに事実を選んだときに少なくとも1人が男の子であれば、両方が男の子である確率は
このパラドックスは、「少なくとも1人は男の子である」という命題がどのように生成されたかが不明な場合に発生します。仮定に基づいて、どちらの答えも正しい可能性があります。[ 11 ]
しかし、「1/3「答えは、P(ALOB | BG) = P(ALOB | GB) = 1 と仮定することによってのみ得られ、これは P(ALOG | BG) = P(ALOG | GB) = 0 を意味します。つまり、もう一人の子供の性別は存在するにもかかわらず、決して言及されないということです。マークスとスミスは、「しかし、この極端な仮定は二人の子供の問題の提示には決して含まれておらず、人々がそれを提示するときに念頭に置いていることではないことは確かです。」と述べています。[ 11 ]
曖昧さを分析する別の方法 (質問 2) は、生成プロセスを明示的にすることです (すべての描画は独立しています)。
古典的な確率論に従って、二人の子供が入った大きな壺を考えます。どちらかが男の子か女の子である確率は等しいと仮定します。識別可能な三つのケースは以下のとおりです。
これらは事前確率です。
ここで「少なくとも1人は男の子」=Bという追加の仮定を加える。ベイズの定理を用いると、
ここで、P(A|B)は「Bが生まれた場合のAの確率」を意味します。P(B|BB) = 両方が男の子の場合に少なくとも1人が男の子である確率 = 1。P(BB) = 両方が男の子である確率 = 1/4事前分布から。P(B) = 少なくとも1人が男の子である確率(BBとG·Bのケースを含む) = 1/4 + 1/2 = 3/4。
自然な仮定は、確率がであるように思われるが、1/2なので、 の導出値は1/3低いように見えますが、P(BB)の実際の「正常」値は1/4、だから1/3は実際にはもう少し高いです。
このパラドックスは、2つ目の仮定がやや不自然であるため、実際の状況で問題を説明する際に少々厄介な問題となる。一体どのようにして「少なくとも」1人が男の子だと分かるのだろうか?ある説明では、窓から中を覗くと、1人の子供しか見えず、それが男の子だとしている。これは同じ仮定のように見える。しかし、これは分布を「サンプリングする」(つまり、壺から1人の子供を取り出し、それが男の子であることを確認してから、再び入れる)ことと等価である。「サンプルは男の子である」という命題を命題「b」と呼ぶことにしよう。すると、以下のようになる。
ここでの違いはP(b)であり、これはすべての可能なケース(つまり「少なくとも」を含まない)から男の子が出てくる確率であり、明らかに1/2。
ベイズ分析は、50:50の母集団仮定を緩和したケースにも容易に一般化できます。母集団に関する情報がない場合は、「平坦な事前分布」、すなわちP(GG) = P(BB) = P(G·B) = を仮定します。1/3 . この場合、「少なくとも」という仮定は、P(BB|B) = という結果をもたらします。1/2、そしてサンプリング仮定はP(BB|b) = を生成する。2/3 、これも継承のルールから導き出される結果です。
ガードナーによるパラドックスの普及後、様々な形で提示され、議論されてきました。バー=ヒレルとフォーク[ 3 ]が提示した最初の変種は、以下の通りです。
バー=ヒレルとフォークはこの変種を用いて、根底にある前提を考慮することの重要性を強調しています。直感的な答えは1/2そして、最も自然な仮定をすれば、これは正しい。しかし、ある人はこう主張するかもしれない。「スミス氏がその少年を自分の息子だと特定する前は、彼が2人の男の子BBの父親であるか、2人の女の子GGの父親であるか、あるいは出生順でそれぞれ1人ずつ、つまりBGかGBの父親であるかしか分かっていない。ここで再び独立性と等確率性を仮定すると、 という確率から始める。」1/4スミスは2人の男の子の父親です。少なくとも1人の男の子がいることがわかったため、GG事象は除外されます。残りの3つの事象は等確率であるため、確率はとなります。1/3BBのために。」[ 3 ]
スミス氏が子供の同伴者をランダムに選んだというのが自然な仮定です。もしそうであれば、BBの組み合わせは、BGまたはGBのいずれかが男の子の同伴者を生み出す確率の2倍です(GGの組み合わせは確率が0なので除外されます)。したがって、BGとGBの事象の和はBBと等確率となり、もう一方の子供が男の子である確率は1/2しかし、Bar-HillelとFalkは別のシナリオを提案している。彼らは、散歩の仲間として常に男の子が女の子よりも選ばれる文化を想定する。この場合、BB、BG、GBの組み合わせは、男の子が散歩の仲間となる確率が等しく、したがって、もう1人の子供も男の子である確率は1/3。
1991年、マリリン・ボス・サヴァントは、ビーグル犬を含む「男の子か女の子か」のパラドックスの変種について答えてほしいという読者からの質問に回答しました。[ 5 ] 1996年、彼女は別の形で同じ質問を再び発表しました。1991年と1996年の質問はそれぞれ以下の通りでした。
2番目の定式化に関して、ヴォス・サヴァントは、女性が2人の男の子を産む確率は約という古典的な答えを与えました。1/3一方、男性が2人の男の子を産む確率は約1/2。ヴォス・サヴァントは、自身の分析に疑問を呈する読者からの回答を受けて、少なくとも1人は男の子を含む2人の子供を持つ読者を対象に調査を実施した。17,946件の回答のうち、35.9%が男の子が2人いると回答した。[ 9 ]
ヴォス・サヴァントの記事は、2005年にカールトンとスタンスフィールド[ 9 ]によって『アメリカン・スタティスティシャン』誌に掲載された論文で論じられた。著者らは質問の曖昧さの可能性については議論しておらず、子供が男の子か女の子かの確率は等しく、2人目の子供の性別は1人目の子供の性別とは無関係であるという仮定に基づき、彼女の回答は数学的観点から正しいと結論付けている。著者らは、彼女の調査について、「少なくとも、元の質問で提示された「可能性」は似ているように聞こえるものの、実際には異なり、最初の確率は2分の1よりも3分の1に近いという、ヴォス・サヴァントの正しい主張を裏付けている」と述べている。
カールトンとスタンスフィールドは、「男の子か女の子か」のパラドックスにおける共通の仮定について議論を進め、現実には男の子が生まれる可能性の方が女の子よりも高いこと、そして二人目の子供の性別は一人目の子供の性別と独立ではないことを実証した。著者らは、この問題の仮定は観察結果に反するものの、このパラドックスは「条件付き確率のより興味深い応用例の一つを示している」ため、依然として教育的価値があると結論付けている。[ 9 ]もちろん、実際の確率値は重要ではない。このパラドックスの目的は、一見矛盾しているように見える論理を示すことであり、実際の出生率を示すことではない。
スミス氏には2人の子供がいて、そのうち1人は男の子で、その男の子が火曜日に生まれたと伝えられたとしましょう。これはこれまでの分析結果に変化をもたらすでしょうか?ここでも、答えは、この情報がどのように提示されたか、つまりどのような選択プロセスによってこの知識が生み出されたかによって決まります。
問題の伝統に従い、二人の子供がいる家庭において、二人の子供の性別は互いに独立しており、男の子か女の子かは同確率で、それぞれの子供の誕生日は他の子供とは独立していると仮定する。曜日ごとに生まれる確率は1/7。
ベイズの定理によれば、火曜日に男の子が 1 人生まれた場合、男の子が 2 人生まれる確率は次のように表されます。
火曜日に生まれる確率がε = であると仮定します。1/7これは一般解に到達した後に設定されます。分子の2番目の因数は単純に1/4 は、男の子が2人生まれる確率です。分子の最初の項は、家族に男の子が2人いる場合に、火曜日に少なくとも1人の男の子が生まれる確率、つまり1 − (1 − ε ) 2(火曜日に男の子が2人とも生まれない確率から1を引いた値)です。分母については、次のように分解します。
各項は確率で重み付けされる1/4。最初の項は0(男の子はいない)、最後の項は前のコメントで既に分かっています。そしてεなので、男の子はたった一人しかいないので、火曜日に生まれる確率は ε です。したがって、完全な式は次のようになります 。
の場合、これは
εがに設定されている場合1/7、確率は13/27、つまり約0.48です。実際、εが0に近づくにつれて、全体の確率は1/2 は、1人の子供(例えば、長男が男の子)を抽出し、可能性のある子供のプールから除外した場合に期待される答えです。言い換えれば、男の子についての詳細(例えば、1月1日生まれ)が与えられるほど、もう1人の子供が女の子である確率は半分に近づきます。[ 12 ]
全く関係のない情報が導入されたようですが、他の子供の性別の確率は以前とは劇的に変化しました(他の子供が女の子である確率は2/3(男の子が火曜日に生まれたことは知られていなかった)。
なぜそうなるのかを理解するには、マリリン・フォス・サヴァントが読者アンケートで、その家族の中で男の子が生まれた曜日を尋ねたと想像してみてください。マリリンがデータセット全体を7つのグループ(男の子が生まれた曜日ごとに1つずつ)に分けたとしたら、男の子が2人いる7家族のうち6家族は2つのグループ(男の子1が生まれた曜日のグループと男の子2が生まれた曜日のグループ)にカウントされ、どのグループでも男の子同士の組み合わせの確率が2倍になります。
しかし、火曜日に少なくとも1人の男の子が生まれた家族が、そのような家族の中からランダムに1つだけ選ばれたことによって作られたというのは、本当にあり得ることなのでしょうか?次のシナリオを想像する方がはるかに簡単です。
2人の子供のうちどちらがドアを開けるかは偶然に決まると仮定する。手順は(1) 2人の子供がいるすべての家庭からランダムに1家族を選ぶ (2) 2人の子供のうち1人をランダムに選ぶ (3) それが男の子かどうかを確認し、生まれた日を尋ねる。もう1人の子供が女の子である確率は1/2これは、 (1)火曜日生まれの2人の子供(少なくとも1人は男の子)を持つすべての家族から、2人の子供がいる家族をランダムに選ぶという手順とは全く異なります。その家族が男の子と女の子の2人で構成される確率は、14/27、約0.52。
この男の子と女の子の問題の変種は多くのインターネットブログで議論されており、ルマ・フォークの論文の主題にもなっています。[ 13 ]この話の教訓は、これらの確率は既知の情報だけでなく、その情報がどのように得られたかによっても決まるということです。
統計分析の観点から見ると、関連する問いはしばしば曖昧であり、「正しい」答えは存在しません。しかし、これで「男の子か女の子か」のパラドックスの全てが網羅されたわけではありません。なぜなら、直感的な確率がどのように導かれるかを説明するのは必ずしも曖昧さではないからです。ヴォス・サヴァントのような調査によると、大多数の人々はガードナーの問題に関して、一貫性があればという理解をしています。1/3確率の答えですが、圧倒的に多くの人が直感的に1/2確率の答え。曖昧さはさておき、人間がどのように確率を推定するかを理解しようとする心理学者にとって、この問題は興味深いものとなっています。
フォックスとレヴァフ(2004)は、スミス氏問題と呼ばれる問題(ガードナーが考案したが、ガードナーのバージョンと全く同じ表現ではない)を使って、人々が条件付き確率を推定する方法についての理論を検証した。[ 2 ]この研究では、参加者にパラドックスが2つの方法で提示された。
著者らは、最初の定式化は読者に「他の子供」に2つの結果の可能性があるという誤った印象を与えるが、[ 2 ] 2番目の定式化は読者に4つの結果の可能性があり、そのうち1つが拒否されているという印象を与える(結果として1/3は、両方の子供が男の子である確率です。残りの可能な結果は3つあり、そのうちの1つだけが両方の子供が男の子であるということです。調査では、参加者の85%が1/2最初の定式化では39%が「」と回答したのに対し、2番目の定式化ではわずか39%でした。著者らは、人々がそれぞれの質問に対して異なる回答をする理由(モンティ・ホール問題やベルトランの箱のパラドックスなどの他の類似の問題も同様)は、起こり得る結果の数を適切に定義できない単純なヒューリスティックスが用いられているためだと主張しました。 [ 2 ]