章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。
男孩或女孩悖論
男孩或女孩悖論圍繞概率論中的一組問題,也稱為兩個孩子問題、史密斯先生的孩子和史密斯夫人問題。這個問題的最初表述至少可以追溯到1959年,當時MartinGardner在他1959年10月的《科學美國人》“數學遊戲專欄”中對此進行了專題介紹。他將其命名為“兩個孩子的問題”,並將這個悖論表述如下:
瓊斯先生有兩個孩子。大一點的孩子是個女孩。兩個孩子都是女孩的概率是多少?
史密斯先生有兩個孩子。其中至少有一個是男孩。兩個孩子都是男孩的概率是多少?
加德納最初給出了答案1/2和1/3,但後來承認第二個問題模棱兩可。它的答案可能是1/2,取決於獲得“其中至少一個是男孩”信息的程序。MayaBar-Hillel和RumaFalk,和RaymondS.Nickerson證實了這種歧義,具體取決於確切的措辭和可能的假設。
這個問題的其他變體,具有不同程度的模糊性,已被遊行雜誌中的詢問瑪麗蓮、紐約時報的約翰蒂爾尼、[6]和倫納德姆洛迪諾在酒鬼的步行中推廣。一項科學研究表明,當傳達相同的信息,但使用不同的部分模棱兩可的措辭強調不同的觀點時,回答的MBA學生的百分比1/2從85%變為39%。
這個悖論引發了很多爭議。悖論源於兩個問題的問題設置是否相似。直觀的答案是1/2.如果問題讓讀者相信第二個孩子(即男孩和女孩)的性別有兩種同樣可能的可能性,那麼這個答案是直觀的,並且這些結果的概率是絕對的,不是有條件的。
常見假設
這兩個可能的答案有許多假設。首先,假設所有可能事件的空間可以很容易地列舉出來,提供結果的擴展定義:{BB,BG,GB,GG}。該符號表示有四種可能的兒童組合,分別標記男孩B和女孩G,並使用第一個字母表示年齡較大的孩子。其次,假設這些結果是同樣可能的。這意味著以下模型,一個伯努利過程,p=1/2:
每個孩子要么是男性,要么是女性。
每個孩子成為男性的機會與成為女性的機會相同。
每個孩子的性別獨立於另一個孩子的性別。
如果用拋硬幣來表述,數學結果將是相同的。
第一個問題
瓊斯先生有兩個孩子。大一點的孩子是個女孩。兩個孩子都是女孩的概率是多少?
在上述假設下,在這個問題中,選擇了一個隨機族。在這個樣本空間中,有四個同樣可能的事件:
大一點的孩子年幼的孩子
女孩女孩
女孩男生
男生女孩
男生男生
這些可能的事件中只有兩個符合問題中指定的標準(即GG、GB)。由於新樣本空間{GG,GB}中的兩種可能性都是等可能的,並且兩者中只有一種GG包含兩個女孩,因此年幼的孩子也是女孩的概率為1/2.
第二個問題
史密斯先生有兩個孩子。其中至少有一個是男孩。兩個孩子都是男孩的概率是多少?
此問題與問題一相同,只是沒有指定較大的孩子是男孩,而是指定其中至少一個是男孩。在回應讀者對1959年提出的問題的批評時,加德納說,如果沒有沒有提供的信息,就不可能有答案。具體來說,確定“至少一個是男孩”的兩種不同程序可能導致問題的措辭完全相同。但它們會導致不同的正確答案:
從所有有兩個孩子的家庭中,至少有一個是男孩,隨機選擇一個家庭。這將產生答案1/3.
從所有有兩個孩子的家庭中,隨機選擇一個孩子,並指定該孩子的性別為男孩。這將產生一個答案1/2.
Grinstead和Snell認為這個問題與Gardner所做的一樣模棱兩可。他們留給讀者來決定產生1/3作為答案的過程對於上述問題是否合理。他們具體考慮的問題的表述如下:
考慮一個有兩個孩子的家庭。假設其中一個孩子是男孩,那麼兩個孩子都是男孩的概率是多少?
在這個表述中,歧義最為明顯,因為不清楚我們是否可以假設一個特定的孩子是男孩,而讓另一個孩子不確定,或者是否應該以與“至少一個男生”。這種模棱兩可留下了多種不等價的可能性,並留下了對信息是如何獲得的假設的必要性,正如Bar-Hillel和Falk認為的那樣,不同的假設可能導致不同的結果(因為問題陳述的定義不夠好允許一個簡單的解釋和答案)。
例如,假設一位觀察者看到史密斯先生和他的一個孩子在散步。如果他有兩個男孩,那麼那個孩子一定是男孩。但如果他有一個男孩和一個女孩,那個孩子可能是一個女孩。所以看到他和一個男孩在一起,不僅消除了他有兩個女孩的組合,而且消除了他有一個兒子和一個女兒並選擇女兒一起走路的組合。
因此,雖然每個可能的Smith先生至少有一個男孩,這當然是真的(即,條件是必要的),但不能假設每個Smith先生至少有一個男孩是有意的。也就是說,問題陳述並沒有說生男孩是史密斯先生以這種方式被認定為生男孩的充分條件。
評論Gardner的問題版本時,Bar-Hillel和Falk指出“史密斯先生,與讀者不同,在發表此聲明時可能知道他兩個孩子的性別”,即“我有兩個孩子,其中至少有一個是男孩。”必須進一步假設,如果這是真的,史密斯先生總是會報告這個事實,並且要么保持沉默,要么說他至少有一個女兒,正確答案是1/3正如加德納原本打算的那樣。但在這種假設下,如果他保持沉默或說他有一個女兒,那麼他有兩個女兒的概率是100%。
歧義分析
如果假設該信息是通過觀察兩個孩子是否至少有一個男孩而獲得的,則該條件既是必要的又是充分的。上述樣本空間中一個二孩家庭的四個等概率事件中有三個滿足條件,如下表所示:
大一點的孩子年幼的孩子
女孩女孩
女孩男生
男生女孩
男生男生
因此,如果假設在尋找男孩時考慮了兩個孩子,那麼問題2的答案是1/3.但是,如果首先選擇了該家庭,然後對該家庭中一個孩子的性別做出了隨機的、真實的陳述,無論是否考慮了兩者,計算條件概率的正確方法不是計算所有案例其中包括具有該性別的孩子。相反,人們必須只考慮在每種情況下做出陳述的概率。因此,如果ALOB表示語句為“至少一個男孩”的事件,而ALOG表示語句為“至少一個女孩”的事件,則此表描述了樣本空間:
大一點的孩子年幼的孩子P(這個家庭)P(給定這個家庭的ALOB)P(給定這個家庭的ALOG)P(ALOB和這個家庭)P(ALOG和這個家庭)
女孩女孩1/40101/4
女孩男生1/41/21/21/81/8
男生女孩1/41/21/21/81/8
男生男生1/4101/40
因此,如果隨機選擇事實時至少有一個是男孩,那麼兩個都是男孩的概率是
P(AL○BAndBB)P(AL○B)=140+18+18+14=12.
當不知道“至少一個是男孩”這一陳述是如何產生的時,就會出現悖論。根據假設,任何一個答案都可能是正確的。
但是,那”1/3"答案只能通過假設P(ALOB|BG)=P(ALOB|GB)=1得到,這意味著P(ALOG|BG)=P(ALOG|GB)=0,即永遠不會有另一個孩子的性別提到雖然它存在。正如Marks和Smith所說,“然而,這個極端的假設從未包含在二孩問題的呈現中,而且肯定不是人們在呈現它時所想的。”
生成過程建模
另一種分析歧義的方法(對於問題2)是明確生成過程(所有繪製都是獨立的)。
以下過程導致答案p(C1=C2=B|observATIon)=13:
畫C1等可能來自{B,G}
畫C2等可能來自{B,G}
丟棄沒有B的情況
觀察C1=B∨C2=B
以下過程導致答案p(C1=C2=乙|○bservATIon)=12:
畫C1等可能來自{B,G}
畫C2等可能來自{B,G}
繪製索引I等可能來自{1,2}
觀察CI=B
貝葉斯分析
遵循經典概率論點,我們考慮一個包含兩個孩子的大骨灰盒。我們假設男孩或女孩的概率相等。因此,三種可辨別的情況是:
都是女孩(GG)–概率P(GG)=1/4,
都是男孩(BB)–概率為P(BB)=1/4,和
每個(G·B)之一–概率為P(G·B)=1/2.
這些是先驗概率。
現在我們添加“至少一個是男孩”=B的附加假設。使用貝葉斯定理,我們發現
P(BB∣B)=P(B∣BB)×P(BB)P(B)=1×(14)(34)=13.
其中P(A|B)表示“A給定B的概率”。P(B|BB)=至少有一個男孩的概率,假設兩個男孩都是男孩=1。P(BB)=兩個男孩的概率=1/4從之前的分佈。P(B)=至少有一個是男孩的概率,包括案例BB和G·B=1/4+1/2=3/4.
請注意,儘管自然假設似乎是1/2,所以派生值1/3看起來很低,P(BB)的實際“正常”值是1/4,所以1/3實際上是高了一點。
之所以出現悖論,是因為第二個假設有些人為,在實際環境中描述問題時,事情變得有些棘手。我們怎麼知道“至少”一個是男孩?對問題的一種描述是,我們看著一扇窗戶,只看到一個孩子,它是一個男孩。這聽起來像是相同的假設。然而,這相當於對分佈進行“抽樣”(即從骨灰盒中取出一個孩子,確定它是男孩,然後替換)。讓我們稱“樣本是男孩”命題為“b”。現在我們有:
P(BB∣b)=P(b∣BB)×P(BB)P(b)=1×(14)(12)=12.
這裡的區別是P(b),它只是從所有可能的情況下(即沒有“至少”)畫出男孩的概率,這顯然是1/2.
貝葉斯分析很容易推廣到我們放寬50:50人口假設的情況。如果我們沒有關於人口的信息,那麼我們假設一個“平坦的先驗”,即P(GG)=P(BB)=P(G·B)=1/3.在這種情況下,“至少”假設產生結果P(BB|B)=1/2,抽樣假設產生P(BB|b)=2/3,一個結果也可以從繼承規則中推導出來。
鞅分析
假設有人打賭史密斯先生有兩個男孩,並且得到了公平的賠率。一個支付1美元,如果他有兩個男孩,他們將收到4美元。隨著好消息的到來,他們的賭注將增值。什麼證據會讓他們對自己的投資更滿意?得知兩個孩子中至少有一個是男孩,或者得知一個孩子中至少有一個是男孩?
後者是先驗的不太可能,因此是更好的消息。這就是為什麼兩個答案不能相同的原因。
現在是數字。如果我們押註一個孩子並贏了,他們的投資價值就會翻倍。它必須再次翻倍才能達到4美元,所以賠率是1比2。
另一方面,如果得知兩個孩子中至少有一個是男孩,投資就會增加,就好像他們在這個問題上下註一樣。我們的1美元現在值1美元1+1/3.為了達到4美元,我們仍然需要將我們的財富增加三倍。所以答案是三分之一。
問題的變體
隨著加德納悖論的普及,它以各種形式被提出和討論。Bar-Hillel&Falk提出的第一個變體措辭如下:
史密斯先生是兩個孩子的父親。我們遇到他和一個小男孩走在街上,他自豪地把他介紹為他的兒子。史密斯先生的另一個孩子也是男孩的概率是多少?
Bar-Hillel&Falk使用這個變體來強調考慮基本假設的重要性。直觀的答案是1/2而且,在做出最自然的假設時,這是正確的。然而,有人可能會爭辯說:“……在史密斯先生認定這個男孩是他的兒子之前,我們只知道他是兩個男孩BB的父親,或者是兩個女孩GG的父親,或者是其中一個的父親。出生順序,即BG或GB。再次假設獨立性和等概率性,我們從概率開始1/4史密斯是兩個男孩的父親。發現他至少有一個男孩排除了事件GG。由於其餘三個事件是等概率的,我們得到一個概率1/3為BB。”
自然的假設是史密斯先生隨機選擇了孩子同伴。如果是這樣,由於組合BB導致男孩步行同伴的概率是BG或GB的兩倍(並且組合GG的概率為零,排除它),事件BG和GB的並集變得與事件BB等概率,並且所以另一個孩子也是男孩的機會是1/2.然而,Bar-Hillel&Falk提出了一種替代方案。他們想像一種文化,在這種文化中,男孩總是被選為步行夥伴而不是女孩。在這種情況下,假設BB、BG和GB的組合同樣可能導致男孩步行同伴,因此另一個孩子也是男孩的概率為1/3.
1991年,瑪麗蓮·沃斯·薩凡特(MarilynvosSavant)回應了一位讀者,該讀者要求她回答男孩或女孩悖論的一個變體,其中包括小獵犬。1996年,她再次以不同的形式發表了這個問題。1991年和1996年的問題分別表述為:
一位店主說她有兩隻新的小比格犬要給你看,但她不知道它們是公的、母的還是一對。你告訴她你只想要一個男性,她就給給他們洗澡的人打電話。“至少有一個是男性嗎?”她問他。“是的!”她笑著告訴你。另一個是男性的概率是多少?
假設一個女人和一個男人(沒有血緣關係)各有兩個孩子。我們知道,至少有一個女人的孩子是男孩,而男人最大的孩子是男孩。你能解釋為什麼女人生兩個男孩的機會不等於男人生兩個男孩的機會嗎?
關於第二個提法,VosSavant給出了一個經典的答案,即女人有兩個男孩的機會大約是1/3而這個男人有兩個男孩的機會大約是1/2.作為對質疑她分析的讀者反應的回應,vosSavant對恰好有兩個孩子的讀者進行了一項調查,其中至少一個是男孩。在17,946份回復中,35.9%的人報告了兩個男孩。
卡爾頓和斯坦斯菲爾德在美國統計學家2005年的一篇文章中討論了VosSavant的文章。作者沒有討論問題中可能存在的歧義,並得出結論認為她的答案從數學角度來看是正確的,假設一個孩子是男孩或女孩的可能性是相等的,並且第二個孩子的性別是獨立的第一個。關於她的調查,他們說它“至少驗證了vosSavant的正確斷言,即原始問題中提出的“機會”雖然聽起來相似,但不同,而且第一個概率肯定更接近三分之一而不是1在2中。”
卡爾頓和斯坦斯菲爾德繼續討論男孩或女孩悖論中的常見假設。他們證明,實際上男孩實際上比女孩更有可能,並且第二個孩子的性別並不獨立於第一個孩子的性別。作者得出的結論是,儘管問題的假設與觀察結果背道而馳,但這個悖論仍然具有教學價值,因為它“說明了條件概率的更有趣的應用之一”。當然,實際的概率值並不重要;這個悖論的目的是展示看似矛盾的邏輯,而不是實際的出生率。
關於孩子的信息
假設我們不僅被告知史密斯先生有兩個孩子,其中一個是男孩,而且還告訴我們這個男孩是在星期二出生的:這是否改變了之前的分析?同樣,答案取決於這些信息是如何呈現的——什麼樣的選擇過程產生了這種知識。
按照問題的傳統,假設在二孩家庭的人口中,兩個孩子的性別相互獨立,男孩或女孩的可能性相同,並且每個孩子的出生日期都與另一個孩子無關.在一周中的任何一天出生的機會是1/7.
根據貝葉斯定理,假設一個男孩在星期二出生,兩個男孩的概率由下式給出:
P(BB∣BT)=P(BT∣BB)×P(BB)P(BT)
假設星期二出生的概率是ε=1/7這將在到達通用解決方案後設置。分子中的第二個因素很簡單1/4,有兩個男孩的概率。分子中的第一項是至少一個男孩在星期二出生的概率,假設這個家庭有兩個男孩,或1-(1-ε)2(一個減去兩個男孩都不是在星期二出生的概率)。對於分母,讓我們分解:P(BT)=P(BT∣BB)P(BB)+P(BT∣BG)P(BG)+P(BT∣GB)P(GB)+P(BT∣GG)P(GG).每個術語都以概率加權1/4.第一個詞已經被前面的註釋知道了,最後一個詞是0(沒有男孩)。P(BT∣BG)和P(Bt∣Gb)是ε,只有一個男孩,因此他有ε機會在星期二出生。因此,完整的方程為:
P(Bb∣Bt)=(1-(1-ε)2)×140+14ε+14ε+14(ε+ε−ε2)=1−(1−ε)24ε-ε2
為了ε>0,這減少到p(Bb∣Bt)=2-ε4-ε
如果ε現在設置為1/7,概率變為13/27,或約0.48。事實上,當ε接近0時,總概率變為1/2,這是對一個孩子進行抽樣(例如,最大的孩子是男孩)並因此從可能的孩子池中刪除時所期望的答案。換句話說,隨著男孩子的細節越來越多(例如:1月1日出生),另一個孩子是女孩的機會接近一半。
似乎引入了非常不相關的信息,但是另一個孩子的性別的概率與以前相比發生了巨大的變化(另一個孩子是女孩的可能性是2/3,當不知道男孩是在星期二出生時)。
要理解為什麼會這樣,想像一下MarilynvosSavant的讀者調查詢問了家庭中男孩在一周中的哪一天出生。如果Marilyn然後將整個數據集分為七組-一周中的每一天都有一個兒子出生-七個有兩個男孩的家庭中有六個將被分為兩組(出生男孩一周中的那一天)1,以及男孩出生星期幾的組2),在每組中,男孩-男孩組合的概率加倍。
然而,至少有一個男孩在星期二出生的家庭是隨機選擇一個這樣的家庭產生的,這真的合理嗎?想像以下場景要容易得多。
我們知道史密斯先生有兩個孩子。我們敲他的門,一個男孩走過來應門。我們問這個男孩是在一周中的哪一天出生的。
假設兩個孩子中的哪一個會開門是由偶然決定的。然後程序是(1)從所有二孩家庭中隨機挑選一個二孩家庭(2)隨機挑選兩個孩子中的一個,(3)看是不是男孩,問他是哪天出生的.另一個孩子是女孩的機會是1/2.這與(1)從周二出生的所有有兩個孩子(至少一個男孩)的家庭中隨機挑選一個有兩個孩子的家庭是完全不同的程序。家庭由男孩和女孩組成的機會是14/27,約0.52。
許多互聯網博客都討論了男孩和女孩問題的這種變體,並且是RumaFalk的一篇論文的主題。這個故事的寓意是,這些概率不僅取決於已知信息,還取決於如何獲得該信息。
心理調查
從統計分析的角度來看,相關問題通常是模棱兩可的,因此沒有“正確”的答案。然而,這並沒有窮盡男孩或女孩悖論,因為它不一定是解釋直覺概率是如何得出的模糊性。像vosSavant的一項調查表明,大多數人對Gardner問題的理解是,如果他們保持一致,就會導致他們1/3概率答案,但絕大多數人憑直覺得出1/2概率答案。儘管模棱兩可,但這使得尋求了解人類如何估計概率的心理學研究人員感興趣的問題。
Fox&Levav(2004)使用該問題(稱為史密斯先生問題,歸功於Gardner,但措辭與Gardner的版本不完全相同)來測試人們如何估計條件概率的理論。在這項研究中,悖論以兩種方式向參與者提出:
“史密斯先生說:‘我有兩個孩子,其中至少有一個是男孩。’鑑於這些信息,另一個孩子是男孩的概率是多少?”
“史密斯先生說:‘我有兩個孩子,但他們並不是都是女孩。’鑑於這些信息,兩個孩子都是男孩的概率是多少?”
作者認為,第一種表述給讀者的印像是“另一個孩子”有兩種可能的結果,而第二種表述給讀者的印像是有四種可能的結果,其中一個已經被被拒絕(導致1/3是兩個孩子都是男孩的概率,因為還有3個可能的結果,其中只有一個是兩個孩子都是男孩)。研究發現85%的參與者回答1/2對於第一種配方,只有39%的人對第二種配方有這種反應。作者認為,人們對每個問題的反應不同(以及其他類似問題,例如蒙蒂霍爾問題和伯特蘭盒子悖論)的原因是因為使用了無法正確定義可能結果數量的幼稚啟發式方法。