章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。
保罗·格赖斯
HerbertPaulGrice(1913年3月13日-1988年8月28日),通常以HPGrice、H.PaulGrice或PaulGrice的名义出版,是一位英国语言哲学家。他最出名的是他的暗示理论和合作原则(及其同名的格莱斯格言),这成为语用学语言领域的基本概念。他的意义工作也影响了语义学的哲学研究。
生活
他在英国的Harbourne(现为伯明翰郊区)出生长大,先后在克利夫顿学院和牛津科珀斯克里斯蒂学院接受教育。在罗索尔学校短暂任教后,他回到牛津,首先从1936年到1938年在默顿学院担任研究生,然后从1938年在圣彼得堡大学担任讲师、研究员和导师约翰学院。二战期间,格莱斯在皇家海军服役;战后,他回到圣约翰学院担任研究员,直到1967年。那年,他移居美国,在加州大学伯克利分校担任教授,并在那裡任教至1988年去世。他于1979年回到英国,为约翰·洛克(JohnLocke)讲授理性方面的讲座。他在他的告别书《词法研究》(1989年)中重印了他的许多论文和论文。
格莱斯于1942年与凯瑟琳·沃森结婚;他们有两个孩子。
格赖斯的意义
格赖斯对语言和交流研究的两个最有影响力的贡献之一是他的意义理论,他在1948年撰写的文章“意义”中开始发展这一理论,但在他的同事PFStrawson的推动下于1957年才发表。格赖斯在1967年在哈佛大学发表的关于“逻辑与对话”的威廉·詹姆斯的第五和第六次讲座中进一步发展了他的意义理论。这两个讲座最初于1969年出版为“Utterer'sMeaningandIntentions”和“Utterer的意义、句子意义和词义”,1968年,1989年。
自然与非自然的意义
在1957年的文章“意义”中,格赖斯使用“那些斑点意味着(意味着)麻疹”的例子来描述“自然意义”。
并使用“约翰意味着他会迟到”或“'Schnee'意味着'下雪'”的例子来描述“非自然意义”。
格赖斯没有定义动词“意思”的这两种含义,也没有提供一个明确的理论来区分它们用来表达的想法。相反,他依靠普通语言用法的五个差异来表明我们以(至少)两种不同的方式使用这个词。
基于意图的语义
对于“意义”的其馀部分,以及他在“逻辑与对话”中对意义的讨论,格赖斯只处理非自然意义。他研究非自然意义的整体方法后来被称为“基于意图的语义学”,因为它试图根据说话者的意图来解释非自然意义。为此,格赖斯区分了两种非自然含义:
说话者的意思:说话者所说的意思。(Grice直到“LogicandConversation”才引入这个标籤。当代作品中更常见的标籤是“speakermeaning”,儘管Grice没有使用这个词。)
永恆的意义:一种话语可以拥有的意义,例如一个词或一个句子。(这通常被称为“传统意义”,儘管Grice没有这麽称呼它。)
基于意图的语义学的两个步骤是(1)根据说话者公开的受众导向意图来定义说话者的意思,然后(2)根据说话者的意思来定义永恆的意义。最终效果是用纯粹的心理术语来定义所有语言的意义概念,从而为语义领域提供心理启示。
Grice尝试通过以下定义完成第一步:
“A用x表示NN某事”大致相当于“A说出x的意图是通过识别这个意图来诱导一个信念”。
(在这个定义中,'A'是一个跨越说话者的变量,而'x'是一个跨越话语的变量。)Grice在后面的“意义”中概括了说话者意义的这个定义,以便它适用于命令和问题,他论证与断言的不同之处在于,说话者意图诱导一种意图而不是一种信念。Grice的最初定义是有争议的,并且似乎产生了各种反例,以及后来的基于意图的语义学的追随者——包括Grice本人,StephenSchiffer,JonathanBennett,DanSperber和DeirdreWilson,和StephenNeale——试图以各种方式对其进行改进,同时保持基本思想不变。
接下来,格赖斯转向他的程序的第二步:用说话者的意义概念来解释永恆意义的概念。他非常尝试性地使用以下定义:
“x表示NN(永恆的)某某”可能首先等同于关于“人们”(含煳)打算(带有关于“认可”的限定词)通过x实现的某些陈述或陈述的分离。
这裡的基本思想是,单词或句子的含义源于说话者使用单词或句子的含义的规律性。格莱斯将在他的第六次逻辑与对话讲座中给出更详细的关于永恆意义的理论。StephenSchiffer给出了一个更有影响力的尝试来扩展基于意图的语义的这个组件。
格赖斯的含意理论
更多信息:合作原则和含义
格赖斯对哲学和语言学最有影响力的贡献是他的隐含理论,该理论始于他1961年的文章“感知的因果理论”和1967年在哈佛大学的“威廉詹姆斯讲座”上发表的“逻辑与对话”,以及于1975年作为语法和语义学:言语行为第3卷的一章出版。
说/暗示区别
根据格赖斯的说法,说话者通过话语表达的意思可以分为说话者“所说”的内容和说话者由此“暗示”的内容。
格赖斯明确表示,他所想到的“说”的概念虽然与该词的口语含义有关,但在一定程度上是技术性的,称其为“一种必须进一步阐明的受欢迎的‘说’概念”。儘管如此,格赖斯从未完全阐明或定义他喜欢的说概念,而对这一概念的解释已成为语言哲学中一个有争议的问题。
围绕格赖斯偏爱的说法概念的争议之一是它与他的说话者意义概念之间的联繫。格赖斯明确表示,他将说视为一种意义,在某种意义上说,做前者就意味着做后者:“我想说(1)“U(utterer)说p”蕴含(2)”U做了某事x,而U的意思是p”(87)。这个条件是有争议的,但Grice认为,明显的反例——说话者显然说某事没有意义的情况——实际上是他所谓的“makeasiftosay”,这可以被认为是一种“假说”或“玩说”。
围绕Grice的“说”概念的另一个争议点是说话者在表达中所说的内容与该表达的永恆意义之间的关係。儘管他多次尝试详细说明这种联繫,他认可的最准确的陈述是以下陈述:
在我使用“说”这个词的意义上,我希望某人所说的内容与他所说的词(句子)的常规含义密切相关。
不幸的是,格赖斯从未阐明他在这段话中所说的“密切相关”一词的含义,语言哲学家继续就其最佳解释进行辩论。
在“感知的因果理论”中,格赖斯将说(他在那裡也称为“陈述”)与“暗示”进行对比,但在《逻辑与对话》中,他引入了技术术语“暗示”及其同源词“暗示”和“暗示”"(即,所涉及的内容)。格赖斯通过说“'暗示'是一个笼统的词来避免必须在'暗示'、'建议'、'指示'和'意思'等词之间做出选择”来证明这种新词的合理性。
格赖斯总结了这些概念,暗示暗示是执行“非中心”的言语行为,而说是执行“中心”的言语行为。正如其他人更普遍地提出相同的区别,说是一种“直接”的言语行为,而暗示是一种“间接的”言语行为。后一种区分的方式是约翰·塞尔(JohnSearle)有影响的言语行为理论的重要组成部分。
传统与会话含义
虽然Grice最出名的是他的会话含义理论,但他也引入了传统含义的概念。两者之间的区别在于,说话者通常通过说出一个句子所暗示的内容在某种程度上与句子部分的永恆意义相关联,而说话者会话暗示的内容与永恆意义没有直接关係。格赖斯最着名的传统暗示例子涉及“但是”这个词,他认为,它与“并且”这个词的含义不同,只是因为我们通常习惯性地暗示一些超出我们所说的与前者而不是与后者。在说出这句话'她很穷但她很诚实',例如,我们只说她很穷而且她很诚实,但我们暗示贫穷与诚实形成对比(或她的贫穷与诚实形成对比)。
Grice清楚地表明,说话者通常通过说出一个句子所暗示的内容是说话者在说出它时所要表达的意思的一部分,并且它也与句子的意思密切相关。儘管如此,说话者通常暗示的内容并不是说话者所说内容的一部分。
你在做x可能是他说出了一句话“她很穷,但她很诚实”。U的意思和句子的意思都将包含“但是”这个词所贡献的东西,我不希望这种贡献出现在对U所说的(在我喜欢的意义上)的描述中(而是作为一个常规的含意)。
Grice没有详细阐述传统含义的概念,但许多其他作者试图给出更广泛的理论,包括LauriKarttunen和StanleyPeters,KentBach,StephenNeale,和Christopher波茨。
会话含义
根据格赖斯的说法,在说话中以会话方式暗示某事是指超出某人所说的内容,以至于必须从会话情境的非语言特徵以及交流和合作的一般原则中推断出来。
格赖斯提出的一般原则是他所谓的合作原则和对话准则。根据Grice的说法,合作原则是管理人类之间所有合作互动的规范。
合作原则:“按照你所参与的谈话交流的公认目的或方向,在它发生的阶段做出你需要的贡献。”(格莱斯1989:26)。
会话准则可以被认为是专门处理交流的合作原则的精确化。
数量准则:信息
根据当前交流目的所需的信息,做出您的贡献。
不要让您的贡献超出要求的信息量。
质量准则:真理
不要说你认为是假的。
不要说你缺乏足够证据的话。
关係准则:相关性
是相关的。
方式准则:清晰(“显而易见”)
避免表达晦涩难懂。
避免歧义。
简短(避免冗长)。
有条不紊。
格赖斯通过提出“一个人可能需要其他人”来遵循他对格言的总结,并继续说“当然,还有各种其他格言(审美的、社会的或道德的),例如“成为礼貌”,这也是交流参与者通常所遵守的,这些也可能产生非常规的含义。”
根据格赖斯的说法,对话的含义之所以成为可能,是因为对话中的参与者总是假设对方按照准则行事。因此,当说话者似乎违反了一条准则,说或假装在说一些虚假、信息量不足或信息量过大、不相关或不清楚的东西时,假设说话者实际上遵守了准则,解释者就会推断关于说话者真正意思的假设。口译员将可靠地做到这一点,允许讲话者故意“蔑视”格言——即,以一种对讲话者和口译员都显而易见的方式製造违反格言的表象——以传达其含义。
或许Grice最着名的会话含义示例是参考字母的情况,即“数量含义”(即,因为它涉及蔑视Quantity的第一条准则):
A正在写一篇关于一名学生的推荐信,该学生是一名哲学职位的候选人,他的信中写道:“尊敬的先生,X先生的英语水平非常好,他经常参加辅导课。您的等等。"(光泽:A不能选择退出,因为如果他不想合作,为什麽还要写?他不可能因为无知而不能说更多,因为这个人是他的学生;而且,他知道的信息比这更多被通缉。因此,他一定希望传达他不愿写下的信息。只有当他认为X先生不擅长哲学时,这个假设才成立。那麽,这就是他所暗示的。)
鑑于说话者通过给定的话语表示给定的命题p,Grice提出了p必须具备的几个特徵才能算作会话含义。
不可分离性:“暗示是不可分离的,因为不可能找到另一种方式来表达同样的事情(或大致相同的事情),而这只是缺乏暗示。”
可取消性:“......一个假定的会话暗示是明确可取消的,如果对于其话语的话语形式假定暗示p,可以添加但不可以添加p,或者我不是暗示p,并且它如果人们能找到某种情况,在这种情况下,单词形式的话语根本不带有暗示,那麽它在上下文中是可以取消的。”
非常规性:“......会话暗示不是它们所附加的表达的含义的一部分。”
可计算性:“会话含义的存在必须能够被计算出来;因为即使它实际上可以直观地掌握,除非直觉可以被论证取代,否则含义(如果存在的话)将不能算作会话含义;它将是传统含义。”
广义与具体的会话含义
Grice还区分了一般化和特殊化的会话含义。格赖斯说,特定的会话含义(例如在上面引用的参考信案例中)出现在“通过上下文的特殊特徵在特定场合说p来携带含义的情况下,在这种情况下没有有这样一种想法的空间,这种暗示通常是通过说p来表达的。”相比之下,广义暗示出现在“人们可以说在话语中使用某种形式的词通常(在没有特殊情况下)会带有这样那样的暗示或类型的情况下”。含蓄的。”Grice没有提供关于广义会话含义的完整理论,一方面将它们与特定会话含义区分开来,另一方面与传统含义区分开来,但后来的哲学家和语言学家试图扩展广义会话含义的概念。
格莱斯悖论
在他的着作《词法研究》(1989)中,他提出了他所谓的格莱斯悖论。在其中,他假设两个国际象棋棋手Yog和Zog在以下条件下下了100场比赛:
(1)约格是十次中的九次。
(2)没有平局。
结果是:
(1)约格,当白人时,赢得了90场比赛中的80场。
(2)Yog,当黑棋时,十局零胜。
这意味着:
(i)8/9次,如果Yog是白人,Yog赢了。
(ii)1/2的时间,如果Yog输了,Yog是黑色的。
(iii)9/10要么Yog不是白人,要么他赢了。
从这些陈述中,似乎可以通过对立和条件析取进行这些推论:
([ii]中的[a])如果Yog是白人,那麽Yog获胜的机率是1/2。
([b]from[iii])9/10次,如果Yog是白人,那麽他赢了。
但是(a)和(b)都是不真实的——它们与(i)相矛盾。事实上,(ii)和(iii)没有提供足够的信息来使用贝叶斯推理来得出这些结论。如果(i)-(iii)改为这样陈述,那可能会更清楚:
(i)当约格是白人时,约格赢了8/9次。(没有给出关于Yog何时变黑的信息。)
(ii)当Yog输掉时,Yog是黑色的1/2时间。(没有提供有关Yog何时获胜的信息。)
(iii)9/10次,或者Yog是黑色的并且获胜,Yog是黑色的并且输了,或者Yog是白色的并且获胜。(没有提供关于9/10如何在这三种情况之间划分的信息。)
格莱斯悖论表明,涉及条件和概率的陈述的确切含义比随意检查时可能显而易见的要復杂得多。
不及物骰子
如果一组骰子包含三个骰子A、B和C,则一组骰子是不及物的(或不及物的),其属性是A掷得比B高一半以上,B掷得比C高一半以上,但是,A比C高出一半以上的时间是不正确的。换句话说,一组骰子是不传递的,如果二元关係——X比Y掷出更多的数字超过一半的时间——在其元素上是不传递的。更简单地说,A通常击败B,B通常击败C,但A通常不会击败C。
有可能找到具有更强特性的骰子组,即对于该组中的每个骰子,都有另一个骰子在一半以上的时间内掷出的数字高于它。不同之处在于,不再只是“A通常不会击败C”,而是现在“C通常会击败A”。(参见示例)。
例子
考虑以下一组骰子。
模具A有2、2、4、4、9、9面。
模具B有1、1、6、6、8、8面。
模具C有3、3、5、5、7、7面。
A掷出的数字比B高的概率、B掷出的数字高于C的概率以及C掷出的数字高于A的概率都是5/9,所以这组骰子是不及物的。事实上,它具有更强大的特性,即对于该组中的每个骰子,都有另一个骰子比它掷出的骰子数多于一半。
现在,考虑下面的游戏,它是用一组骰子玩的。
第一个玩家从该组中选择一个骰子。
第二个玩家从剩馀的骰子中选择一个骰子。
两名玩家掷骰子;掷出较高数字的玩家获胜。
如果这个游戏是用一组可传递的骰子来玩的,要么公平,要么偏向第一个玩家,因为第一个玩家总是可以找到一个不会被任何其他骰子击败的骰子超过一半的时间。但是,如果使用上述一组骰子进行游戏,则游戏会偏向于第二个玩家,因为第二个玩家总是可以找到一个骰子,该骰子很有可能击败第一个玩家的骰子5/9.下表显示了所有三对骰子的所有可能结果。
玩家1选择骰子A
玩家2选择骰子C
一个
C
249
3C一个一个
5CC一个
7CC一个
玩家1选择骰子B
玩家2选择骰子A
一个
168
2一个乙乙
4一个乙乙
9一个一个一个
玩家1选择骰子C
玩家2选择骰子B
乙
357
1CCC
6乙乙C
8乙乙乙
关于不及物骰子等价的评论
虽然三个不及物骰子A、B、C(第一组骰子)
答:2、2、6、6、7、7
B:1、1、5、5、9、9
C:3、3、4、4、8、8
P(A>B)=P(B>C)=P(C>A)=5/9
和三个不及物骰子A'、B'、C'(第二组骰子)
A':2,2,4,4,9,9
B':1,1,6,6,8,8
C':3,3,5,5,7,7
P(A'>B')=P(B'>C')=P(C'>A')=5/9
以相等的概率互相取胜,它们不相等。第一组骰子(A、B、C)的骰子“最高”,而第二组骰子的骰子“最低”。滚动一组骰子的三个骰子并始终使用最高分数进行评估,这将显示两组骰子的不同获胜模式。用第一组骰子,骰子B以最高概率获胜(11/27)并且骰子A和C各赢的概率分别为8/27.用第二组骰子,骰子C'将以最低的概率获胜(7/27)并且骰子A'和B'将各自获胜的概率分别为10/27.
变化
埃夫隆的骰子
Efron骰子是BradleyEfron发明的一组四个不及物骰子。
四个骰子A、B、C、D在它们的六个面上有以下数字:
答:4、4、4、4、0、0
B:3、3、3、3、3、3
C:6、6、2、2、2、2
D:5、5、5、1、1、1
概率
每个骰子都被列表中的前一个骰子击败,概率为2/3:
P(A>B)=P(B>C)=P(C>D)=P(D>A)=23
B的值是恆定的;A击败它2/3滚动,因为它的六个面中有四个更高。
同样,B以a击败C2/3概率,因为只有C的两个面更高。
P(C>D)可以通过对两个事件的条件概率求和来计算:
C卷6(概率1/3);不管D如何都获胜(概率1)
C卷2(概率2/3);仅当D掷出1时才获胜(概率1/2)
因此,C获胜的总概率为
(13×1)+(23×12)=23
通过类似的计算,D战胜A的概率为
(12×1)+(12×13)=23
最佳整体模具
四个骰子击败从其馀三个中随机选择的骰子的概率不相等:
如上所述,骰子A在三分之二的时间内击败B,但在三分之一的时间内击败D。A击败C的概率为4/9(A必须掷4,C必须掷2)。所以A击败任何其他随机选择的骰子的可能性是:
13×(23+13+49)=1327
同样,骰子B在三分之二的时间内击败C,但在三分之一的时间内击败A。骰子B击败D的概率为1/2(仅当D掷出1时)。所以B击败任何其他随机选择的骰子的可能性是:
13×(23+13+12)=12
骰子C在三分之二的时间内击败D,但在三分之一的时间内击败B。骰子C击败A的概率是5/9.所以C击败任何其他随机选择的骰子的可能性是:
13×(23+13+59)=1427
最后,骰子D在三分之二的时间内击败了A,但只有三分之一的时间击败了C。D击败B的概率为1/2(仅当D掷出5时)。所以D击败任何其他随机选择的骰子的可能性是:
13×(23+13+12)=12
因此,最好的整体骰子是C,获胜概率为0.85。C也滚动了绝对值的最高平均数,3+1/3.(A的平均值是2+2/3,而B和D都是3。)
具有相等平均值的变体
注意Efron的骰子有不同的平均掷骰数:A的平均掷骰数是8/3,而B和D各取平均值9/3,和C平均值10/3.不传递属性取决于哪些面更大或更小,但不取决于面的绝对大小。因此,可以找到Efron骰子的变体,其中获胜机率不变,但所有骰子的平均掷骰数相同。例如,
答:7、7、7、7、1、1
B:5、5、5、5、5、5
C:9,9,3,3,3,3
D:8、8、8、2、2、2
这些变体骰子很有用,例如,向学生介绍比较随机变量的不同方法(以及如何仅比较平均值可能会忽略基本细节)。
编号1到24的骰子
使用所有数字1到24的一组四个骰子可以被设为不及物。对于相邻的对,一个骰子获胜的概率是2/3。
对于滚动高数,B击败A,C击败B,D击败C,A击败D。
答:1、0
B:3、0_
C:6、09、23、24_
D:10、11、12、13、14、15
与埃夫隆骰子的关係
这些骰子与Efron的骰子基本相同,因为单个骰子上一系列连续数字中的每个数字都可以替换为该系列的最低数字,然后重新编号。
A:1,2,16,17,18,19→1,1,16,16,16,16→0,0,4,4,4,4
B:3,4,5,20,21,22→3,3,3,20,20,20→1,1,1,5,5,5
C:6,7,8,9,23,24→6,6,6,6,23,23→2,2,2,2,6,6
D:10,11,12,13,14,15→10,10,10,10,10,10→3,3,3,3,3,3
米温的骰子
米温骰子由物理学家迈克尔温克尔曼于1975年发明。
考虑一组三个骰子,III、IV和V,使得
dieIII有边1、2、5、6、7、9
dieIV有边1,3,4,5,8,9
模具V有边2、3、4、6、7、8
然后:
III掷出的数字大于IV的概率是17/36
IV掷出的数字大于V的概率是17/36
V掷出的数字大于III的概率是17/36
三套骰子,对标准骰子的改动很小
与1到6标准骰子相比,以下不及物骰子只有一些区别:
与标准骰子一样,总点数始终为21
与标准骰子一样,边上的点数仅在1到6之间
具有相同点数的面每个骰子最多出现两次
每个骰子只有两个面的数字与标准骰子不同:
答:1、1、3、5、5、6__
B:2、3、3、4、4、5__
C:1、2、2、4、6、6_
像Miwin的设置一样,A对B(或B对C,C对A)获胜的概率是17/36.然而,平局的概率是4/36,因此36次掷骰中只有15次失败。所以整体获胜预期更高。
沃伦·巴菲特
众所周知,沃伦巴菲特是不及物骰子的粉丝。在《财富的公式:击败赌场和华尔街的科学博彩系统的不为人知的故事》一书中,描述了他和EdwardThorp之间的讨论。巴菲特和索普讨论了他们对不及物骰子的共同兴趣。“这是一种数学上的好奇心,一种‘诡计’骰子,它混淆了大多数人对概率的看法。”
巴菲特曾试图用不及物骰子与比尔盖茨一起赢得一场骰子游戏。“巴菲特建议他们每个人选择一个骰子,然后丢掉另外两个。他们会赌谁掷的次数最多。巴菲特提出让盖茨先选择他的骰子。这个建议立刻引起了盖茨的好奇。他要求检查骰子,然后他要求巴菲特先选择。”
2010年,《华尔街日报》杂誌援引巴菲特的桥牌搭档莎朗·奥斯伯格的话说,当她20年前第一次访问他的办公室时,他诱骗她玩一个无法赢得的不及物骰子游戏,并“认为这很有趣”。
为两个以上玩家设置的不及物骰子
许多人引入了不及物骰子的变体,其中一个人可以与多个对手竞争。
三名球员
奥斯卡骰子
OskarvanDeventer介绍了一组七个骰子(所有面都有概率1/6)如下:
答:2、14、14、17、17
B:7,7,10,10,16,16
C:5,5,13,13,15,15
D:3、09、21、21
E:1、12、12、20、20
F:6、0_
G:4,4,11,11,18,18
可以验证A击败{B,C,E};B击败{C,D,F};C击败{D,E,G};D击败{A,E,F};E击败{B,F,G};F击败{A,C,G};G击败{A,B,D}。因此,对于任意选择的两个骰子,会有第三个骰子同时击败这两个骰子。即,
G击败{A,B};F击败{A,C};G击败{A,D};D击败{A,E};D击败{A,F};F击败{A,G};
A击败{B,C};G击败{B,D};A击败{B,E};E击败{B,F};E击败{B,G};
B击败{C,D};A击败{C,E};B击败{C,F};F击败{C,G};
C击败{D,E};B击败{D,F};C击败{D,G};
D击败{E,F};C击败{E,G};
E击败{F,G}。
无论两个对手选择什麽,第三个玩家都会找到剩下的一个骰子击败两个对手的骰子。
汙垢骰子
JamesGrime博士发现了一组五个骰子,如下所示:
答:2、2、2、7、7、7
B:1、1、6、6、6、6
C:0、5、5、5、5、5
D:4、4、4、4、4、9
E:3、3、3、3、8、8
可以验证,当使用一组Grime骰子玩游戏时:
A击败B击败C击败D击败E击败A(第一链);
A击败C击败E击败B击败D击败A(第二链)。
然而,当游戏使用两个这样的组合时,第一个链保持不变(除了稍后讨论的一个例外),但第二个鍊是相反的(即A击败D击败B击败E击败C击败A)。因此,无论两个对手选择什麽骰子,第三个玩家总能找到剩下的一个骰子击败他们(只要允许玩家在单骰选项和双骰选项之间进行选择):
对手选择的套路获胜的骰子
类型数字
一个乙乙1
一个C乙2
一个DC2
一个乙D1
乙C一个1
乙D一个2
乙乙D2
CD乙1
C乙乙2
D乙C1
然而,这套系统有两个主要问题。第一个是在游戏的双骰子选项中,第一条链应该保持完全相同,以使游戏不及物。但在实践中,D实际上击败了C。第二个问题是必须允许第三个玩家在单骰选项和双骰选项之间进行选择——这可能被视为对其他玩家不公平。
修正汙垢骰子
之所以出现上述D击败C的问题是因为骰子有6个面而不是5个。通过将每个骰子的最低(或最高)面替换为“重掷”(R),所有五个骰子将完全按照JamesGrime博士的预期发挥作用:
答:R、2、2、7、7、7
B:R,1,6,6,6,6
C:R,5,5,5,5,5
D:R,4,4,4,4,9
E:R、3、3、3、8、8
或者,这些面可以映射到一组五角梯形(10面)骰子,每个数字恰好出现两次,或者映射到一组二十面体(20面)骰子,每个数字出现四次。这消除了对“重新滚动”面的需要。
这个解决方案是由澳大利亚职前数学老师JonChambers发现的。
四名球员
尚未发现四人套装,但已证明这样的套装至少需要19个骰子。
不及物四面骰子
四面体可以用作骰子,有四种可能的结果。
设置1
答:1、4、7、7
B:2、6、6、6
C:3,5,5,8
P(A>B)=P(B>C)=P(C>A)=9/16
下表显示了所有可能的结果:
乙
一个
2666
1乙乙乙乙
4一个乙乙乙
7一个一个一个一个
7一个一个一个一个
在“AvsB”中,A赢了16场比赛中的9场。
C
乙
3558
2CCCC
6乙乙乙C
6乙乙乙C
6乙乙乙C
在“B对C”中,16场比赛中,B赢了9场。
一个
C
1477
3C一个一个一个
5CC一个一个
5CC一个一个
8CCCC
在“CvsA”中,C赢了16场比赛中的9场。
设置2
答:3、3、3、6
B:2、2、5、5
C:1、4、4、4
P(A>B)=P(B>C)=10/16,P(C>A)=9/16
不及物12面骰子
与不及物六面骰子类似,也有十二面体作为不及物十二面骰子。每个骰子上的点的总和为114。每个十二面体上没有重複的数字。
Miwin的十二面体(第1组)以35:34的比例循环战胜对方。
miwin的十二面体(第2组)以71:67的比例週期性地相互战胜。
设置1:
三级紫色的125679101114151618
Ⅳ红色的134589101213141718
DV深灰色234678111213151617
第2组:
六青色1234910111213141718
D七梨绿12567891015161718
八浅灰色345678111213141516
不及物素数12面骰子
也可以构造不及物十二面体的集合,使得没有重複的数字并且所有数字都是素数。Miwin的不及物素数十二面体以35:34的比率週期性地相互竞争。
第1组:数字加起来为564。
PD11灰色到蓝色131729313743475367717383
PD12灰色到红色131923294143475961677983
PD13灰色到绿色171923313741535961717379
第2组:数字加起来为468。
PD1橄榄色到蓝色71119232937434753616771
PD2蓝绿色到红色71317193137414359616773
PD3紫色到绿色111317232931414753597173
蒙蒂霍尔问题
蒙蒂霍尔问题是一个脑筋急转弯,以概率谜题的形式,松散地基于美国电视游戏节目让我们做个交易,并以其原始主持人蒙蒂霍尔命名。这个问题最初是在1975年史蒂夫·塞尔文(SteveSelvin)给美国统计学家的一封信中提出(并解决)的。它因读者CraigF.Whitaker在MarilynvosSavant的“Ask1990年Parade杂誌《玛丽莲》专栏:
假设你在看一个游戏节目,你可以选择三扇门:一扇门后面是一辆车;另一扇门后面是一辆车;在其他人之后,山羊。你选择一扇门,比如1号,主人知道门后是什麽,然后打开另一扇门,比如3号门,裡面有一隻山羊。然后他对你说:“你想选2号门吗?”改变你的选择对你有利吗?
VosSavant的回应是参赛者应该切换到另一扇门。在标准假设下,切换策略具有2/3赢得汽车的概率,而保留初始选择的策略只有1/3可能性。
当玩家第一次做出选择时,有一个2/3汽车在未选择的一扇门后面的可能性。主人在其中一扇未选择的门后面发现一隻山羊后,这个概率不会改变。当主持人提供有关2扇未选择的门的信息时(显示其中一扇后面没有汽车),2/3汽车在其中一扇未选择的门后面的机会取决于未选择和未显示的门,而不是1/3汽车在参赛者最初选择的门后的可能性。
给定的概率取决于关于主持人和参赛者如何选择门的具体假设。一个关键的见解是,在这些标准条件下,关于门2和3的信息比游戏开始时玩家选择门1时可获得的信息更多:主人的故意行为为他没有选择的门增加了价值选择淘汰,但不淘汰参赛者最初选择的那个。另一个见解是,切换门与在剩馀的两扇门之间随机选择是不同的动作,因为第一个动作使用先前的信息,而后者不使用。除了所描述的之外,主机的其他可能行为可以揭示不同的附加信息,或者根本没有,并产生不同的概率。
vosSavant专栏的许多读者拒绝相信转换是有益的,并拒绝接受她的解释。Parade出现问题后,约有10,000名读者,包括近1,000名拥有博士学位的读者写信给该杂誌,其中大多数人认为vosSavant错了。即使给出了解释、模拟和正式的数学证明,许多人仍然不接受转换是最好的策略。PaulErdős是历史上最多产的数学家之一,他一直不相信,直到他看到一个计算机模拟来证明vosSavant的预测结果。
这个问题是一个真实类型的悖论,因为解决方案是如此违反直觉,以至于看起来很荒谬,但仍然可以证明是正确的。蒙蒂霍尔问题在数学上与早期的三个囚徒问题和更古老的伯特兰盒子悖论密切相关。
悖论
史蒂夫·塞尔文(SteveSelvin)在1975年给美国统计学家写了一封信,描述了一个基于游戏节目Let'sMakeaDeal的问题,在随后的一封信中将其称为“蒙蒂霍尔问题”。该问题在数学上等同于MartinGardner1959年在《科学美国人》的“数学游戏”专栏中描述的三囚徒问题和Gardner的书AhaGotcha中描述的三壳问题。
标准假设
在标准假设下,切换后中奖的概率为2/3.这个解决方案的关键是主机的行为。Parade版本中的歧义没有明确定义主机的协议。然而,与Whitaker的问题一起打印的MarilynvosSavant的解决方案暗示,并且Selven和vosSavant都明确定义了主机的角色如下:
主持人必须始终打开参赛者未选择的门。
主人必须总是打开一扇门才能露出山羊而不是汽车。
主人必须始终提供在最初选择的门和其馀关闭的门之间切换的机会。
当这些假设中的任何一个发生变化时,它可以通过切换门来改变获胜的概率,如下节所述。通常还假设汽车最初是随机隐藏在门后的,如果玩家最初选择汽车,那麽主机选择打开哪个隐藏山羊的门是随机的。一些作者独立或包容地假设玩家的初始选择也是随机的。
简单的解决方案
vosSavant在Parade中提出的解决方案显示了三扇门后一辆车和两隻山羊的三种可能安排,以及在每种情况下最初选择门1后停留或切换的结果:
1号门后门后23号门后如果住在#1门的结果如果切换到提供的门的结果
山羊山羊车赢山羊胜车
山羊车山羊赢山羊胜车
车山羊山羊胜车赢山羊
坚持最初选择的玩家只能在这些相同可能性中的三分之一中获胜,而切换的玩家则在三分之二中获胜。
一个直观的解释是,如果参赛者最初选择了一隻山羊(3个门中的2个),则参赛者将通过切换来赢得汽车,因为另一隻山羊不能再被选中——主持人必须透露它的位置——而如果参赛者最初选择汽车(3个门中的1个),参赛者不会通过切换赢得汽车。使用切换策略,输赢仅取决于参赛者最初是否选择了山羊(2/3概率)或汽车(1/3可能性)。主人随后在其中一扇未选择的门中展示了一隻山羊,这一事实并没有改变初始概率。
大多数人得出的结论是,切换并不重要,因为有两扇未打开的门和一辆车,这是一个50/50的选择。如果主人随机打开一扇门,这将是正确的,但事实并非如此;打开的门取决于玩家的初始选择,因此独立的假设不成立。主人开门前有一个1/3汽车在每扇门后面的概率。如果汽车在1号门后,则主机可以打开2号门或3号门,因此汽车在1号门后且主机打开3号门的概率为1/3×1/2=1/6.如果汽车在2号门后(并且玩家选择了1号门),则主机必须打开3号门,因此汽车在2号门后且主机打开3号门的概率为1/3×1=1/3.这些是主人打开门3的唯一情况,所以如果玩家选择了门1并且主人打开了门3,那麽汽车在门2后面的可能性是门1后面的两倍。关键是,如果汽车是在2号门后主机必须打开3号门,但如果汽车在1号门后,主机可以打开任一门。
理解解决方案的另一种方法是将两个原始未选择的门一起考虑。正如塞西尔亚当斯所说,“蒙蒂实际上是在说:你可以保留一扇门,也可以拥有另外两扇门。”这2/3打开其中一扇门并没有改变找到汽车的机会,因为蒙蒂知道汽车的位置,肯定会露出一隻山羊。因此,主人打开一扇门后玩家的选择与主人为玩家提供从最初选择的门切换到剩下的两扇门的选项没有什麽不同。这种情况下的开关显然给玩家一个2/3选车的概率。
正如KeithDevlin所说,“通过打开门,蒙蒂对参赛者说‘有两扇门是你没有选择的,而奖品在其中一扇后面的概率是2/3.我会利用我对奖品所在位置的了解来帮助您打开这两扇门中的一扇,向您展示它并没有隐藏奖品。您现在可以利用这些附加信息。您选择的门A有三分之一的机会成为获胜者。我没有改变这一点。但是通过消除门C,我已经向你展示了门B隐藏奖品的概率是2比3。'"
VosSavant建议使用1,000,000扇门而不是3扇门,该解决方案将更加直观。在这种情况下,有999,999扇门后面有山羊,一扇门有奖品。玩家选择一扇门后,主机打开剩馀的999,998扇门。平均而言,在1,000,000次中有999,999次,剩下的门将包含奖品。直觉上,玩家应该问,给定一百万扇门,他们最初选择正确的门的可能性有多大。斯蒂贝尔等人提出在蒙蒂霍尔问题期间对工作记忆需求徵税,这迫使人们将他们的选择“折叠”成两个同样可能的选择。他们报告说,当选项数量增加到超过7个选项(7个门)时,人们倾向于更频繁地切换;然而,大多数参赛者在50:50仍然错误地判断成功的概率。
VosSavant和媒体的狂热
VosSavant在她关于MontyHall问题的第一篇专栏中写道,玩家应该切换。她收到了数千封读者的来信——其中绝大多数,包括许多拥有博士学位的读者,都不同意她的回答。在1990-1991年间,她在Parade中的另外三个专栏专门讨论这个悖论。来自vosSavant专栏读者的大量信件示例在《蒙蒂霍尔困境:卓越的认知错觉》中进行了介绍和讨论。
讨论在其他场所重播(例如,在塞西尔亚当斯的“TheStraightDope”报纸专栏),并在纽约时报等主要报纸上进行了报导。
为了澄清她的答案,她提出了一个贝壳游戏来说明:“你把目光移开,我把一颗豌豆放在三个贝壳中的一个下。然后我让你把手指放在一个贝壳上。你的选择包含豌豆是1/3,同意吗?然后我只是从剩下的另外两个中取出一个空壳。无论您选择什麽,我都可以(并且将)这样做,我们没有学到任何东西可以让我们修改您手指下的贝壳上的赔率。”她还提出了一个类似的模拟三张扑克牌。
VosS_答案(“开关”)是错误的。
困惑和批评
混乱的来源
当第一次遇到蒙蒂霍尔问题时,绝大多数人假设每扇门都有相同的概率,并得出结论认为切换无关紧要。在一项研究的228名受试者中,只有13%的人选择转换。在他的着作《逻辑思维的力量》[中,认知心理学家马西莫·皮亚泰利·帕尔马里尼[it]写道:“没有其他统计谜题能如此接近于一直愚弄所有人[甚至诺贝尔物理学家也系统地给出了错误的答案,他们坚持在它上面,他们准备斥责那些提出正确答案的人。”鸽子反复暴露于这个问题表明他们很快学会了总是转换,不像人类。
该问题的大多数陈述,尤其是Parade中的陈述,与实际游戏节目的规则不符,并且没有完全说明主持人的行为或汽车的位置是随机选择的。然而,克劳斯和王认为,即使没有明确说明,人们也会做出标准假设。
儘管这些问题在数学上意义重大,但即使控制了这些因素,几乎所有人仍然认为两扇未打开的门中的每一扇都有相同的概率,并得出结论认为切换无关紧要。这种“等概率”假设是一种根深蒂固的直觉。人们强烈倾向于认为概率均匀分佈在尽可能多的未知数中,无论它是否存在。
这个问题继续引起认知心理学家的注意。大多数人的典型行为,即不转换,可以用心理学文献中已知的现象来解释:
禀赋效应,人们倾向于高估已经选择的——已经“拥有”的——门的获胜概率。
现状偏差,[人们更愿意坚持他们已经选择的门。
遗漏错误与佣金效应错误,其中,在所有其他条件相同的情况下,人们更喜欢通过不作为(保持)而不是行动(转换)来犯错误。
实验证据证实,这些是不依赖于概率直觉的似是而非的解释。另一种可能是人们的直觉根本就不是处理教科书版的问题,而是用真实的游戏节目设定。在那裡,只有在最初选择了带有汽车的门时,表演大师才有可能通过打开其他门进行欺骗。一个表演大师欺骗性地玩了一半的时间会修改获胜机会,以防有人提供切换到“等概率”。
对简单解决方案的批评
如前所述,概率领域的大多数资源,包括许多介绍性概率教科书,都通过显示汽车在门1和门2后面的条件概率来解决问题。1/3和2/3(不是1/2和1/2)假设参赛者最初选择了1号门,而主持人打开了3号门;前面的小节给出了推导和理解这个结果的各种方法。
在这些来源中,有几个明确批评了普遍提出的“简单”解决方案,称这些解决方案“正确但......不稳定”,或不“解决所提出的问题”,或“不完整”,或者是“没有说服力和误导性的”,或者是(最直接的)“错误的”。
SashaVolokh(2015)写道:“任何说‘门1的概率是1/3,并且没有什麽可以改变......'自动变得可疑:概率是我们对世界无知的表达,新信息可以改变我们无知的程度。”
有人说这些解决方案回答了一个稍微不同的问题——一个措辞是“你必须在开门之前宣布你是否打算换门”。
简单的解决方案以各种方式表明,一个下定决心换车的参赛者将很有可能赢得赛车2/3,因此,如果玩家必须提前在“总是切换”和“总是留下”之间进行选择,那麽切换是获胜的策略。但是,假设玩家选择了门1并且主机打开了门3,则始终切换获胜的概率与切换获胜的概率在逻辑上是不同的概念。正如一位消息人士所说,“[这些问题]之间的区别似乎让许多人感到困惑”。这些不同的事实可以通过改变问题来显示,以便这两个概率具有不同的数值。例如,假设参赛者知道蒙蒂不会在所有合法选择中随机选择第二扇门,而是当有机会在两个失败的门之间进行选择时,蒙蒂会打开右边的门。在这种情况下,以下两个问题有不同的答案:
总是切换赢得汽车的概率是多少?
给定玩家选择了1号门并且主人打开了3号门,通过切换赢得汽车的概率是多少?
第一个问题的答案是2/3,正如“简单”解决方案正确显示的那样。但是第二个问题的答案现在不同了:假设主人打开了3号门(右边的门),汽车在1号门或2号门后面的条件概率是1/2.这是因为蒙蒂偏爱最右边的门意味着如果汽车在1号门后面,他会打开3号门(最初是有概率的)1/3)或者如果汽车在2号门后面(最初也有可能1/3)。对于这种变化,这两个问题产生不同的答案。这部分是因为第二个问题的假设条件(主人打开门3)只会在这个变体中出现概率2/3.然而,只要汽车在每扇门后面的初始概率是1/3,切换永远不会对参赛者不利,因为切换获胜的条件概率总是至少1/2.
在摩根等人。,四位大学教授在《美国统计学家》上发表了一篇文章,声称vosSavant给出了正确的建议,但提出了错误的论点。他们认为,考虑到玩家最初选择1号门和打开的3号门,这个问题询问的是2号门后面的汽车的机会,他们表明这个机会介于1/2和1取决于主机的决策过程给定的选择。只有当决定完全随机时才有机会2/3.
在受邀评论和随后给编辑的信中,Morgan等人得到了一些作家的支持,也受到了其他人的批评;在每种情况下,摩根等人的回复都会与美国统计学家的信件或评论一起发表。沃斯·萨凡特尤其为自己辩护。Morgan等人在对vosSavant的回应中抱怨说,vosSavant仍然没有真正回应他们自己的主要观点。后来在他们对Hogbin和Nijdam的回应中,他们确实同意,当主人确实有选择时,假设主人随机选择一扇完全打开的门是很自然的,因此通过切换获胜的条件概率(即,给定玩家在他必须做出选择)具有相同的价值,2/3,作为通过切换获胜的无条件概率(即,在所有可能的情况下取平均值)。Bell(1992)已经强调了这种等式,他认为Morgan等人的数学上涉及的解决方案只会吸引统计学家,而在对称情况下条件和无条件解决方案的等价性是直观的。
关于vosSavant对问题的表述(如Parade中提出的)是问第一个问题还是第二个问题,以及这种差异是否显着,文献中存在分歧。Behrends总结说:“人们必须仔细考虑这个问题,以确保两种分析都是正确的”;这并不是说它们是相同的。摩根等人的论文的几位批评者。,其贡献与原始论文一起发表,批评作者改变了vosSavant的措辞并误解了她的意图。一位讨论者(威廉·贝尔)认为,是否明确提到(在标准条件下)主机打开哪扇门与是否应该切换无关。
在简单的解决方案中,“组合门解决方案”最接近条件解决方案,正如我们在讨论使用赔率概念和贝叶斯定理的方法时看到的那样。它基于根深蒂固的直觉,即揭示已知信息不会影响概率。但是,知道主人可以打开两个未选择的门之一来展示山羊并不意味着打开特定的门不会影响汽车在最初选择的门后面的概率。关键是,虽然我们事先知道主人会开门并露出一隻山羊,但我们不知道是哪一个他会打开门。如果宿主在隐藏山羊的门之间均匀随机选择(如标准解释中的情况),这个概率确实保持不变,但如果宿主可以在这些门之间非随机选择,那麽宿主打开的特定门揭示了额外的信息。主人总是可以打开一扇门,露出一隻山羊,并且(在问题的标准解释中)汽车在最初选择的门后面的概率不会改变,但这不是因为前者认为后者是真的。基于主机的行为不会影响汽车在最初选择的车辆后面的概率的断言的解决方案似乎有说服力,但除非主机的两个选择中的每一个具有相同的可能性,如果他有选择的话,这种断言就是不真实的。因此,该断言需要被证明;如果没有给出任何理由,解决方案充其量是不完整的。答案可能是正确的,但用来证明它的理由是有缺陷的。
使用条件概率的解决方案和其他解决方案
上面的简单解决方案表明,具有切换策略的玩家以总体概率赢得汽车2/3,即不考虑主机打开了哪扇门。据此,概率领域的大多数来源计算汽车在门1和门2后面的条件概率为1/3和2/3分别给定参赛者最初选择门1和主机打开门3。本节中的解决方案仅考虑玩家选择的那些情况1号门,主人打开3号门。
完善简单的解决方案
如果我们假设主人随机打开一扇门,当给定一个选择时,那麽主人打开哪扇门根本不会告诉我们汽车是否在1号门后面。在简单的解决方案中,我们已经观察到汽车在门1(玩家最初选择的门)后面的概率最初是1/3.此外,主机肯定会打开一扇(不同的)门,因此打开一扇门(未指定哪个门)不会改变这一点。1/3必须是在主机选择门2和主机选择门3的情况下汽车在门1后面的平均概率,因为这是仅有的两种可能性。但是,这两个概率是一样的。因此,它们都等于1/3.这表明,假设玩家最初选择了这扇门并且主机打开了3号门,那麽汽车在1号门后面的机会是1/3,并且假设玩家最初选择了门1并且主机打开了门3,汽车在门2后面的机会是2/3.分析还表明,总体成功率2/3,通过总是切换来实现,无法改进,并强调了已经很明显直观的东西:玩家面临的选择是在最初选择的门和主机关闭的另一扇门之间,这些门上的具体数字无关紧要。
直接计算条件概率
根据定义,在给定参赛者最初选择门1并且主人打开门3的情况下,通过切换获胜的条件概率是事件“汽车在门2后面并且主人打开门3”的概率除以“主人打开门”的概率3"。这些概率可以参考下面的条件概率表或右侧所示的等效决策树来确定。切换获胜的条件概率为1/3/1/3+1/6,即2/3.
下面的条件概率表显示了300个案例,在所有这些案例中,玩家最初选择1号门,平均而言,将根据汽车的位置和主机选择的门打开。
隐藏在3号门后面的汽车
(平均300箱中有100箱)隐藏在1号门后面的汽车
(平均300箱中有100箱)隐藏在2号门后面的汽车
(平均300箱中有100箱)
玩家最初选择1号门,重複300次
主人必须打开门2(100箱)主机随机打开门2
(平均50例)主机随机打开3号门
(平均50例)主人必须打开门3(100箱)
(300人中有100人)可能性1/6
(300人中有50人)可能性1/6
(300人中有50人)可能性1/3
(300人中有100人)
交换胜利切换失败切换失败交换胜利
在主人打开2号门的情况下,
切换的胜率是逗留的两倍(100例对50例)在主人打开3号门的情况下,
切换的胜率是逗留的两倍(100例对50例)
贝叶斯定理
许多概率论领域的概率教科书和文章通过对贝叶斯定理的正式应用推导出条件概率解;其中包括Gill和Henze的着作。使用贝叶斯定理的赔率形式,通常称为贝叶斯规则,使这种推导更加透明。
最初,汽车在三个门后面的可能性相同:门1、门2和门3的赔率是1:1:1。在玩家独立选择门1后,情况仍然如此。根据贝叶斯规则,假设主人打开3号门,汽车所在位置的后验概率等于先验概率乘以贝叶斯因子或似然性,根据定义,这就是新件的概率在考虑的每个假设(汽车位置)下的信息(主机打开门3)。现在,由于玩家最初选择了1号门,如果车在1号门后面,主机打开3号门的机会是50%,如果汽车在2号门后面,则为100%,如果汽车在3号门后面,则为0%。因此贝叶斯因子由比率组成1/2:1:0或等效1:2:0,而先前的赔率是1:1:1。因此,后验概率变为等于贝叶斯因子1:2:0。假设主人打开了3号门,那麽汽车在3号门后面的概率为零,它在2号门后面的可能性是1号门后面的两倍。
RichardGill分析了主机打开门3的可能性如下。假设汽车不在1号门后面,那麽它在2号门或3号门后面的可能性相同。因此,主机打开3号门的机率为50%。假设汽车在1号门后面,那麽主人打开3号门的机会也是50%,因为当主人有选择时,任何一种选择的可能性都是一样的。因此,无论汽车是否在1号门后面,主机打开3号门的机率都是50%。信息“主机打开3号门”对汽车是否在1号门后提供了1:1的贝叶斯因子或似然比。最初,1号门隐藏汽车的机率为2:1.因此,隐藏汽车的门1的后验赔率与之前的赔率相同,均为2:1。
换句话说,主人打开了哪扇门(门2还是门3?)的信息根本没有透露汽车是否在门1后面的任何信息,而这正是所谓的支持者直觉上显而易见的信息。简单的解决方案,或者使用数学证明的习语,“通过对称性显然是正确的”。
直接计算
考虑事件Ci,表示汽车在第i号门后面,取值Xi,用于玩家的选择,取值Hi,用于开门的主人。玩家最初选择门i=1,C=X1,主机打开门i=3,C=H3。
在这种情况下,我们有:
P(H3|C1,X1)=12P(H3|C2,X1)=1P(H3|C3,X1)=0P(Ci)=13P(Ci,Xi)=P(Ci)P(Xi)P(H3|X1)=12
P(H3|X1)=1/2因为这个表达式只依赖于X1,而不依赖于任何Ci。因此,在这个特定的表达式中,主机的选择不取决于汽车在哪裡,一旦选择了X1,就只剩下两扇门了(例如,P(H1|X1)=0);并且P(Ci,Xi)=P(Ci)P(Xi)因为Ci和Xi是独立的事件(玩家不知道汽车在哪裡才能做出选择)。
那麽,如果玩家最初选择1号门,主人打开3号门,我们证明切换获胜的条件概率为:
P(C2|H3,X1)=23
根据贝叶斯规则,我们知道P(A,B)=P(A|B)P(B)=P(B|A)P(A)。将此逻辑扩展到多个事件,例如A,B和C,我们可以使用{A,B,C}的不同子集来计算相交的概率,作为简化计算的工具条件概率:
P(A,B,C)=P(A|B,C)P(B,C)=P(B|A,C)P(A,C)=P(C|A,B)P(A,B)=P(A,B|C)P(C)=P(A,C|B)P(B)=P(B,C|A)P(A)
在我们的例子中,因为我们知道P(H3|C2,X1)=1,所以我们很幸运:
P(C2|H3,X1)=P(C2,H3,X1)P(H3,X1)=P(H3|C2,X1)P(C2,X1)P(H3,X1)=P(C2)P(X1)P(H3|X1)P(X1)=1/31/2=23
战略优势解决方案
回到Nalebuff,在博弈论和决策论的文献中也对蒙蒂霍尔问题进行了很多研究,并且一些流行的解决方案也对应于这一观点。VosSavant要求做出决定,而不是机会。并且汽车如何隐藏以及未选择的门如何打开的机会方面是未知的。从这个角度来看,玩家必须记住,玩家有两个机会做出选择:首先,首先选择哪扇门;其次,是否切换。由于他不知道汽车是如何隐藏的,也不知道主持人是如何做出选择的,他或许可以利用自己的第一选择机会,来抵消包括主持人在内的竞猜节目团队的行动。
继Gill之后,参赛者的策略涉及两个动作:门的初始选择和切换(或坚持)的决定,这可能取决于最初选择的门和主机提供切换的门。例如,一位参赛者的策略是“选择1号门,然后在提供时切换到2号门,并且在提供时不切换到3号门”。存在十二种参赛者的这种确定性策略。
对参赛者策略的初步比较表明,对于每一个策略A,都有另一个策略B“选择一扇门然后不管发生什麽都切换”主导它。无论汽车如何隐藏,无论主人在两隻山羊之间进行选择时使用哪种规则,如果A赢了汽车,那麽B也可以。例如,策略A“选择门1然后一直坚持”策略B“选择门2然后总是在主人暴露一扇门后切换”:A在1号门隐藏汽车时获胜,而B在任一情况下获胜门1或3隐藏了汽车。类似地,策略A“选择门1然后切换到门2(如果提供),但不切换到门3(如果提供)”由策略B“选择门2然后总是切换”支配。如果1号门隐藏了汽车,而蒙蒂选择打开2号门,或者3号门隐藏了汽车,则A获胜。当1号门或3号门隐藏汽车时,策略B获胜,即
在对竞争者做出决定的环境相当普遍的假设下,支配性是在总是切换策略中寻求解决方案的一个强有力的理由。特别是,如果汽车是通过某种随机化装置隐藏的——比如投掷对称或不对称的三面骰子——优势意味着最大化赢得汽车概率的策略将是三种总是切换的策略之一,即它将是首先选择最不可能的门然后切换的策略,无论主机提供哪个门切换。
战略优势将蒙蒂霍尔问题与博弈论联繫起来。在Gill的零和博弈设置中,放弃非切换策略将博弈简化为以下简单的变体:主持人(或电视团队)决定在门上隐藏汽车,参赛者选择两扇门(即在玩家第一个名义上的选择之后剩下的两扇门)。如果汽车在她选择的两扇门之一后面,则参赛者获胜(而她的对手输掉)。
模拟解决方案
一个简单的方法来证明转换策略确实在标准假设下赢得了三分之二的胜利,那就是用纸牌模拟游戏。普通牌组中的三张牌用于代表三扇门;一张“特殊”牌代表汽车门,另外两张牌代表山羊门。
模拟可以重複多次以模拟多轮游戏。玩家选择三张牌中的一张,然后,“主人”查看剩馀的两张牌,丢弃一张山羊牌。如果主人手中剩馀的牌是车牌,则记为转胜;如果主办方持有山羊牌,则该回合记录为保持胜利。由于这个实验重複了几轮,观察到的每种策略的获胜率很可能接近其理论获胜概率,符合大数定律。
重複播放也让我们更清楚为什麽切换是更好的策略。玩家选择他的牌后,已经确定切换是否会为玩家赢得回合。如果这不令人信服,可以用整个甲板进行模拟。在这个变体中,汽车卡在52次中到达主机次,并且无论丢弃多少非汽车卡都留在主机。
变体
这个问题的一个常见变体,被几位学术作者假设为典型问题,并没有做出主人必须统一选择开门的简化假设,而是他使用了一些其他策略。关于哪种形式化具有权威性的混淆导致了相当大的争论,特别是因为这种变体使证明更加複杂,而不会改变玩家总是切换策略的最优性。在这个变体中,玩家可以根据观察到的主机选择有不同的获胜概率,但无论如何切换获胜的概率至少为1/2(并且可以高达1),而通过切换获胜的整体概率仍然恰好是2/3.这些变体有时会连续出现在旨在教授概率论和博弈论基础的教科书和文章中。还研究了相当多的其他概括。
其他主机行为
1990年在Parade上发表的蒙蒂霍尔问题版本并没有明确说明主人总是会打开另一扇门,或者总是提供切换的选择,甚至从不打开露出汽车的门。然而,vosSavant在她的第二个后续专栏中明确表示,预期主人的行为可能只是导致2/3她给出的概率是她最初的答案。“其他任何事情都是一个不同的问题。”“几乎所有批评我的人都理解了预期的情况。我个人阅读了近三千封信(在收到的另外数千封信中),发现几乎每个人都坚持认为,因为仍然存在两个选项(或同等错误),"如果汽车被随机放置在任何门后,则答案如下,无论玩家最初的选择如何,主人都必须打开一扇露出山羊的门,如果有两扇门可用,则随机选择哪一扇打开。其他可能的主机行为以及对切换成功的影响。
在主机必须遵循的一组给定的其他规则中确定玩家的最佳策略是博弈论中研究的问题类型。例如,如果不要求主机提供切换播放器的提议,则如果玩家最初选择了汽车,则主机可能会怀疑主机是恶意的并且更频繁地提供要约。一般来说,这类问题的答案取决于对主人行为的具体假设,可能从“完全无视主人”到“抛硬币,如果正面朝上则换”;见下表的最后一行。
Morgan等人和Gillman都展示了一个更通用的解决方案,其中汽车(均匀)随机放置,但如果玩家最初选择了汽车,主机不受限制均匀随机挑选,这就是他们俩的方式儘管有作者的免责声明,请解释Parade中对问题的陈述。双方都更改了Parade版本的措辞,以在重申问题时强调这一点。他们考虑了这样一种情况,即主人选择揭示两隻山羊,其偏好表示为概率q,其值介于0和1之间。如果主人随机选择q将是1/2切换获胜的概率2/3不管主人打开哪扇门。如果玩家选择了1号门,而主人对3号门的偏好是q,那麽主人打开3号门并且汽车在2号门后面的概率是1/3,而主机打开3号门且汽车在1号门后面的概率为q/3.这些是主机打开门3的唯一情况,因此在主机打开门3的情况下切换获胜的条件概率为1/3/1/3+q/3这简化为1/1+q.由于q可以在0和1之间变化,这个条件概率可以在1/2和1.这意味着,如果玩家最初选择汽车,即使不限制主机随机选择,玩家也不会因为切换而变得更糟。然而,两个消息来源都没有暗示玩家知道q的值是多少,因此玩家不能将概率归因于2/3vosSavant假设是隐含的。
未指定问题中可能的主机行为
主机行为结果
主机的行为与问题的特定版本中所述相同。切换三分之二的时间赢得汽车。
(下面广义形式的具体情况,p=q=1/2)
主人总是展示一隻山羊,并总是提供一个开关。如果他有选择,他选择概率为p的最左边的山羊(这可能取决于玩家的初始选择)和概率q=1-p的最右边的门。如果主人打开最右边的门,切换获胜的概率为1/(1+q)。
“来自地狱的蒙蒂”:只有当玩家的初始选择是获胜门时,主机才会提供切换选项。切换总是会产生山羊。
“读心蒙蒂”:主人提供切换选项,以防客人决定留下来或客人将切换到山羊。切换总是会产生山羊。
“AngelicMonty”:只有当玩家选择错误时,主机才会提供切换选项。切换总是赢得汽车。
“MontyFall”或“IgnorantMonty”:主人不知道门后是什麽,随意打开一个碰巧没有露出汽车的地方。切换赢得汽车一半的时间。
主人知道门后有什麽,并且(在玩家选择之前)随机选择要展示的山羊。只有当玩家的选择恰好与他的不同时,他才提供切换选项。切换赢得汽车一半的时间。
如果参赛者最初选择了汽车,主持人会打开一扇门并提供100%的时间切换,否则为50%的时间。交换胜利1/2纳什均衡的时间。
四阶段两人博弈论。玩家正在与包括主持人在内的节目组织者(电视台)比赛。第一阶段:组织者选择一扇门(选择对玩家保密)。第二阶段:玩家初步选择门。第三阶段:主人开门。第四阶段:玩家做出最终选择。玩家想赢车,电视台想保住它。这是一个零和的两人游戏。根据博弈论中的冯诺依曼定理,如果我们允许双方完全随机策略,则存在极小极大解或纳什均衡。极小极大解(纳什均衡):汽车先均匀随机隐藏,主机选择均匀随机门打开,不暴露汽车,与玩家的门不同;玩家首先选择统一的随机门,然后总是切换到其他关闭的门。以他的策略,玩家至少有获胜的机会2/3,但是电视台播放;以电视台的策略,电视台最多输2/3,但是玩家玩。这两种策略匹配的事实(至少2/3,最多2/3)证明它们形成了极小极大解。
和以前一样,但现在主人可以选择根本不开门。极小极大解(纳什均衡):小车先随机均匀隐藏,主机再不开门;玩家首先随机选择一扇门,然后再不切换。玩家的策略至少保证了获胜的机会1/3.电视台的策略保证最多输一次1/3.
DealorNoDeal案例:主持人要求玩家打开一扇门,然后提供一个开关,以防汽车没有被发现。切换赢得汽车一半的时间。
N门
DLFerguson(1975年在给Selvin的一封信中)建议对原始问题进行N门推广,其中主机打开p个失败的门,然后为玩家提供切换的机会;在这个变体中,切换获胜的概率1ñ⋅ñ-1ñ-p-1.这个概率总是大于1ñ,因此切换总是带来优势。
即使主人只打开一扇门(p=1),玩家最好在任何情况下都切换。随着N变大,优势减小并接近于零。在另一个极端,如果主机打开所有失败的门,但一个(p=N-2)优势随着N的增大而增加(通过切换获胜的概率为N-1/ñ,随着N变得非常大,它接近1)。
量子版
悖论的量子版本说明了一些关于经典或非量子信息与量子信息之间关係的观点,如编码在量子力学系统的状态中。该公式大致基于量子博弈论.三扇门被一个允许三种选择的量子系统取代;打开一扇门并向后看被翻译为进行特定的测量。规则可以用这种语言来表述,玩家的选择再次是坚持最初的选择,或者改用另一个“正交”选项。就像在经典案例中一样,后一种策略结果使机会加倍。但是,如果节目主持人没有以完全量子力学的方式随机分配奖品的位置,玩家可以做得更好,有时甚至可以肯定地赢得奖品。
历史
与蒙蒂霍尔问题相关的几个概率谜题中最早的一个是伯特兰盒子悖论,由约瑟夫伯特兰于1889年在他的概率计算中提出。在这个谜题中,有三个盒子:一个装有两枚金币的盒子,一个装有两枚银币的盒子,一个装有各一枚的盒子。在随机选择一个盒子并随机取出一枚恰好是金币的硬币后,问题是另一枚硬币是金币的概率是多少。与蒙蒂霍尔问题一样,直观的答案是1/2,但概率实际上是2/3.
1959年发表在《科学美国人》的MartinGardner的数学游戏专栏中的三个囚徒问题相当于蒙蒂霍尔问题。这个问题涉及三名被判处死刑的囚犯,其中随机一名被秘密选中被赦免。其中一名囚犯恳求监狱长告诉他将要处决的其他一名囚犯的姓名,认为这不会透露有关他自己命运的任何信息,但会增加他被赦免的机会1/3至1/2.如果提出请求的囚犯是被赦免的人,监狱长有义务(秘密地)掷硬币决定提供哪个名字。问题是知道监狱长的回答是否会改变囚犯被赦免的机会。这个问题相当于蒙蒂霍尔问题;问这个问题的犯人还有一个1/3有机会被赦免,但他未透露姓名的同事有2/3机会。
史蒂夫·塞尔文在1975年给美国统计学家的一封信中提出了蒙蒂霍尔问题。第一封信提出了这个问题,其版本接近15年后在游行中的表述。第二个似乎是“蒙蒂霍尔问题”一词的第一次使用。这个问题实际上是从游戏节目中推断出来的。蒙蒂霍尔确实打开了一扇错误的门来製造兴奋,但提供了一个众所周知的较小奖品——比如100美元现金——而不是选择换门。正如蒙蒂霍尔写信给塞尔文的那样:
如果你上过我的节目,规则对你很有效——选择后没有交易箱。
—蒙蒂霍尔
该问题的一个版本与三年后出现在Parade中的问题非常相似,该版本于1987年发表在《经济展望杂誌》的谜题部分。作为后来的数理经济学作家,纳勒布夫将这个问题视为博弈论中的一个简单而有趣的练习。
“蒙蒂霍尔陷阱”,菲利普马丁1989年在今日桥牌上的文章,将塞尔文的问题作为马丁所说的概率陷阱的一个例子,将非随机信息视为随机信息,并将其与桥牌游戏中的概念联繫起来.
1990年9月,《游行》的MarilynvosSavant的AskMarilyn问答专栏中出现了Selvin问题的重述版本。儘管vosSavant给出了正确答案,即转换将赢得三分之二的时间,但她估计该杂誌收到了10,000封信,其中包括近1,000封由博士签名的信,其中许多是在数学和科学系的信笺抬头上,宣称她的解决方案是错误的。由于反响热烈,Parade发表了史无前例的四篇关于该问题的专栏。作为宣传的结果,该问题赢得了另一个名称“玛丽莲和山羊”。
1990年11月,在CecilAdams的专栏“TheStraightDope”中,对vosSavant的文章进行了同样有争议的讨论。亚当斯最初错误地回答说,剩下的两扇门的机会必须各为二分之一。在一位读者写信纠正亚当斯的数学分析后,亚当斯同意在数学上他错了。“你选择1号门。现在你可以选择:打开1号门,或者打开2号门和3号门。在后一种情况下,如果奖品在任一门后面,你就可以保留奖品。你宁愿有三分之二比三分之一,不是吗?如果你仔细想想,原来的问题给你提供了基本相同的选择。蒙蒂实际上是在说:你可以保留你的一扇门,或者你可以拥有另外两扇门,其中一扇(非奖门)我会为你打开。”亚当斯确实说过游行版本没有说明关键约束,并且没有这些约束,通过切换获胜的机会不一定是三分之二(例如,假设主机总是打开一扇门是不合理的)。然而,许多读者写信声称亚当斯“第一次是对的”,正确的机会是二分之一。
游行专栏及其回应受到了媒体的极大关注,其中包括《纽约时报》的头版报导,其中蒙蒂·霍尔本人接受了採访。霍尔明白问题所在,用车钥匙给记者演示,并解释了Let'sMakeaDeal的实际游戏玩法不同于拼图的规则。霍尔在文章中指出,由于他控制了比赛的进行方式,根据参赛者的心理,理论上的解决方案并不适用于节目的实际游戏玩法。他说,专家们坚持认为概率是二分之一,他并不感到惊讶。“在我向他们展示一扇门后面没有任何东西之后,参赛者会在节目中做出同样的假设,”他说。“他们会认为他们门上的机率现在已经上升到二分之一,所以无论我提供多少钱,他们都不愿意放弃这扇门。通过打开那扇门,我们施加了压力。我们称它为亨利·詹姆斯治疗.它是'螺丝的转动'。”霍尔澄清说,作为一名游戏节目主持人,他不必遵循vosSavant专栏中的谜题规则,也不必总是让一个人有机会切换(例如,如果他可能会立即打开他们的门,如果这是一扇失败的门,可能会给他们钱,让他们不要从失败的门切换到获胜的门,或者可能只有在他们有获胜的门时才允许他们有机会切换)。“如果主机被要求打开一扇门时间和给你一个转换,那麽你应该接受转换,”他说。“但如果他可以选择是否允许转换,请小心。买者自负。这一切都取决于他的心情。”
领带悖论
领带悖论是一个谜题和悖论,对概率论的主观解释描述了一个对双方都有利的悖论赌注。双信封悖论是领带悖论的一种变体。
悖论的陈述
两个人各领一条领带,开始争论谁的领带更便宜。领带较贵的人必须将领带交给对方。
第一人称的理由如下:输赢的可能性相等。如果我输了,那麽我的领带就会失去价值。但如果我赢了,那麽我赢的钱将超过我领带的价值。因此,赌注对我有利。第二个人可以以完全相同的方式考虑下注;因此,自相矛盾的是,似乎两个人在赌注中都有优势。
使用流体智能解决
这个悖论可以通过更仔细地考虑在一种情况下失去的东西(“我的领带的价值”)和在另一种情况下赢得的东西(“比我的领带的价值”)来解决。如果为简单起见假设领带的唯一可能价格是20美元和40美元,并且男人拥有20美元或40美元领带的机会相同,那麽可能出现四种结果(可能性均等):
第一人领带价格第二人领带价格第一人的收益/损失
20美元20美元0
20美元40美元获得40美元
40美元20美元损失40美元
40美元40美元0
第一个人有50%的机会获得中性结果,有25%的机会获得价值40美元的领带,以及25%的机会失去价值40美元的领带。转向输赢情况:如果这个人输了40美元,那麽他的领带价值确实已经损失了;如果他获得了40美元,那麽他获得的收益确实超过了他领带的价值。赢和输的可能性相等,但是我们在输的场景中所说的“他领带的价值”与我们在获胜场景中所说的“超过他领带的价值”的数量相同。因此,任何人都没有赌注的优势。
这个悖论是对两个信封问题的最简单情况的改写,对解析的解释本质上是一样的。
普罗布斯廷悖论
在概率论中,Proebsting悖论是一个论证,似乎表明凯利准则可以导致破产。虽然它可以用数学方法解决,但它提出了一些关于凯利的实际应用的有趣问题,尤其是在投资方面。它由EdwardO.Thorp于2008年命名并首次讨论。这个悖论以其创造者ToddProebsting的名字命名。
悖论的陈述
如果一个赌注赢或输的可能性相同,并支付b倍的赌注,则凯利赌注为:
F*=b-12b
倍财富。例如,如果50/50的赌注赔率为2比1,凯利说赌25%的财富。如果50/50的赌注赔率为5比1,凯利说赌40%的财富。
现在假设一个赌徒得到2比1的赔率并下注25%。如果新投注的赔率变为5比1,他应该怎麽做?他应该选择f*来最大化:
0.5ln(1.5+5F*)+0.5ln(0.75-F*)
因为如果他赢了,他将有1.5(以2比1的赔率赢得25%赌注的0.5)加上5f*;如果他输了,他必须从第一次赌注中支付0.25,从第二次赌注中支付f*。对f*求导并将其设置为零给出:
5(0.75-F*)=1.5+5F*
可以重写:
2.25=10F*
所以f*=0.225。
矛盾的是,如果从一开始就提供5比1的赔率,则总赌注0.25+0.225=0.475大于0.4的凯利赌注。当某些赌注处于不利赔率时,您会下更多赌注,这是违反直觉的。ToddProebsting向EdThorp发送电子邮件询问此事。
EdThorp意识到这个想法可以扩展到让凯利投注者被毁的概率非零。他表明,如果向赌徒提供2比1的赔率,然后是4比1,然后是8比1,依此类推(2n比1,n=1到无穷大)凯利说要下注:
3n-14n
每一次。所有这些赌注的总和是1。所以凯利赌徒有50%的机会输掉他的全部财富。
一般而言,如果投注者以50/50的赔率进行凯利投注,赔率为b1,然后提供b2,他将总共下注:
F*=b2-12b2+b1-14(1F1-1F2).
第一项是投注者在最初提供b2时所投注的金额。如果f2>f1,则第二项是正数,这意味着如果派彩改善,凯利投注者将比刚刚提供第二笔派彩时下注更多,而如果派彩变得更糟,他将比提供时下注更少只有第二次支付。
实际应用
许多赌注的特点是,在结果确定之前,赔率和概率可能会发生变化。例如,在体育博彩中,在赛事举行之前,赔率可能会发生多次变化,并且可能会出现改变结果概率的消息(例如受伤或天气预报)。在投资中,最初以每股20美元购买的股票现在可能以10美元或30美元或任何其他价格出售。一些体育博彩玩家试图通过预测线路变化而不是预测赛事结果来赚取收入。一些交易者专注于证券可能的短期价格走势,而不是其长期基本面前景。
一个典型的投资例子是一个有风险敞口限制的交易者,他说他在任何一隻股票上的风险都不能超过100万美元。这并不意味着他不能损失超过100万美元。如果他以20美元的价格买入100万美元的股票,然后涨到10美元,他可以再买50万美元。如果它达到5美元,他可以再购买500,000美元。如果它变为零,他可能会损失无限多的钱,儘管风险从未超过100万美元。
解析度
没有悖论。凯利的标准是最大化预期增长率;只有在受限条件下,它才对应于最大化日誌。消除悖论的一种简单方法是注意凯利假设概率不会改变。
知道赔率可能会发生变化的凯利投注者可能会将此因素纳入更複杂的凯利投注。例如,假设凯利投注者有一次机会以2比1的赔率下注50/50的命题。他知道以5比1的赔率提供第二次一次性机会的可能性为50%。现在他应该最大化:
0.25ln(1+2F1)+0.25ln(1-F1)+0.25ln(1+2F1+5F2)+0.25ln(1−f1−f2)
关于f1和f2。答案是2比1下注0,并等待以5比1下注的机会,在这种情况下,您下注40%的财富。如果提供5比1赔率的概率小于50%,则0到25%之间的某个金额将以2比1投注。如果提供5比1赔率的概率超过50%,凯利投注者实际上会以2比1的赔率进行负投注(即,投注50/50的结果,如果他赢了,则支付1/2,如果他输了,则支付1)。在任何一种情况下,如果有机会,他以5比1的赔率下注是40%减去2比1下注的0.7倍。
从本质上讲,这个悖论说的是,如果凯利投注者对未来可能提供的投注有错误的信念,他可能会做出次优选择,甚至破产。从长远来看,凯利标准应该比任何本质上不同的策略做得更好,并且只要投注者知道概率和支出,破产的可能性就为零。
AaronBrown对问题的独立考虑使问题更加清晰,也通过电子邮件与EdThorp进行了沟通。在这个公式中,假设投注者首先卖回最初的赌注,然后在第二次支付时进行新的赌注。在这种情况下,他的总赌注是:
F*=b2−12b2−b1−14(1f1−1f2)f2−1f2+1
它看起来与上述Proebsting公式的公式非常相似,只是符号在第二项上颠倒了,并乘以了一个附加项。
例如,给定2比1赔率后跟5比1赔率的原始示例,在此公式中,投注者首先以2比1投注25%的财富。当提供5比1的赔率时,投注者可以出售以0.125的损失退回原来的赌注。如果他赢了,他的2比1赌注支付0.5,如果他输了,则支付0.25。在新的5比1赔率中,如果他赢了,他可以得到0.625的赌注,如果他输了,他的赌注是0.125,这比他在两个州的原始赌注都要好0.125。因此,他最初的赌注现在的值为-0.125。鑑于他的新财富水平为0.875,他的40%赌注(5比1支付的凯利金额)为0.35。
这两种配方是等价的。在最初的公式中,投注者在2比1时下注0.25,在5比1时下注0.225。如果他赢了,他得到2.625,如果他输了,他有0.525。在第二个公式中,投注者有0.875和0.35的赌注,赔率为5比1。如果他赢了,他得到2.625,如果他输了,他有0.525。
第二种表述清楚地表明,行为的改变是由于投资者在提供新的支付时所经历的市值损失。这是金融界的一种自然思维方式,对赌徒来说不太自然。在这种解释中,无限系列的双倍支出不会通过诱使凯利投注者超额投注而毁掉他,而是通过他无法控制的变化榨取他所有的财富。
睡美人问题
睡美人问题是决策理论中的一个难题,每当一个理想理性的认知代理从睡眠中醒来时,她不记得自己以前是否被唤醒过。当被告知她被抛硬币唤醒过一次或两次,一次是正面,两次是反面时,她被问及她对硬币正面朝上的信心程度。
历史
这个问题最初是由ArnoldZuboff在1980年代中期在未发表的作品中提出的(该作品后来被发表为“OneSelf:TheLogicofExperience”),随后是AdamElga的一篇论文。MichelePiccione和ArielRubinstein在他们的论文“关于不完美回忆的决策问题的解释”中首先对不完美回忆的决策问题中的信念形成问题进行了正式分析,其中“心不在焉的悖论”driver”首次被引入,睡美人问题作为示例5进行了讨论。RobertStalnaker给该问题起名为“睡美人”并于1999年在Usenet新闻组rec.puzzles中首次用于广泛讨论。
问题
睡美人自愿进行以下实验,并被告知以下所有细节:週日,她将被安睡。一次或两次,在实验过程中,睡美人会被唤醒、採访,然后用一种使她忘记唤醒的失忆药物重新入睡。将投掷一枚公平的硬币以确定要进行的实验程序:
如果硬币正面朝上,睡美人将仅在周一被唤醒并接受采访。
如果硬币出现反面,她将在周一和周二被叫醒并接受采访。
无论哪种情况,她都将在周三醒来,无需接受采访,实验结束。
任何时候睡美人被唤醒并接受采访时,她都无法分辨是哪一天,或者她之前是否被唤醒过。在採访中,睡美人被问到:“你现在对硬币正面朝上的说法有什麽信心?”
解决方案
这个问题继续产生持续的争论。
第三位
第三个位置认为正面的概率是1/3。AdamElga最初为这个立场辩护如下:假设睡美人被告知并且她完全相信硬币落在了尾巴上。即使是严格限制的无差异原则,考虑到硬币的反面,她对今天是星期一的信任应该等于她对今天是星期二的信任,因为在一种情况下与另一种情况在主观上无法区分。换句话说,P(Monday|Tails)=P(Tuesday|Tails),因此
P(尾巴和星期二)=P(尾巴和星期一)。
现在假设睡美人在醒来时被告知并且完全相信现在是星期一。以正面朝上的客观机会等于反面朝上的机会为指导,它应该成立P(Tails|Monday)=P(Heads|Monday),因此
P(尾部和星期二)=P(尾部和星期一)=P(正面和星期一)。
由于这三个结果对于一个试验来说是详尽的并且是唯一的(因此它们的概率必须加到1),因此每个结果的概率都是论证中前两个步骤的1/3。
另一种说法如下:如果正确的回报是1个单位(赌注本身无论哪种方式都输了),可信度可以被视为理性风险中性投注者下注的金额。在正面场景中,睡美人将花费她的赌註一次,并获得1奖金。在反面场景中,她会花两次赌注,但什麽也得不到。因此,她的期望值是赢了0.5,但也输了1.5倍的赌注,因此即使她的赌注是1/3,她也应该破局。
半边位
DavidLewis对Elga的论文作出回应,认为睡美人认为硬币正面朝上的概率应该是1/2。睡美人在整个实验过程中没有收到新的非自定位信息,因为她被告知了实验的细节。由于她在实验前的可信度是P(Heads)=1/2,因此她应该继续拥有P(Heads)=1/2的可信度,因为她在实验中醒来时没有获得新的相关证据。这直接与第三者的一个前提相矛盾,因为它意味着P(Tails|Monday)=1/3和P(Heads|Monday)=2/3。
双半位置
双半位置认为P(Heads)和P(Heads|Monday)都等于1/2。特别是MikaëlCozic,认为,诸如“今天是星期一”之类的上下文敏感命题对于条件化来说通常是有问题的,并建议使用成像规则来代替,它支持双半位置。
与其他问题的联繫
对觉醒之前发生的事情的信任是与人择原理相关的核心问题。
变化
极致睡美人
这与原来的不同之处在于,如果出现尾巴,则有一百万和一个醒来。它是由尼克博斯特罗姆制定的。
水手的孩子问题
水手的孩子问题,由RadfordM.Neal介绍,有点类似。它涉及定期在港口之间航行的水手。一个港口有一个女人想和他生孩子,隔海有另一个女人也想和他生孩子。水手无法决定他是否会生一个或两个孩子,所以他将把它留给掷硬币。如果是Heads,他将有一个孩子,如果是Tails,他将有两个孩子。但如果硬币落在正面,哪个女人会生他的孩子?他会通过查看港口水手指南来决定这一点,而最先出现在港口的女人将是与他有孩子的女人。你是他的孩子。您没有《港口水手指南》的副本。你是他唯一的孩子的概率是多少,因此硬币落在正面(假设硬币是公平的)?
三囚问题
三囚问题出现在1959年《科学美国人》的MartinGardner的“数学游戏”专栏中。它在数学上相当于将汽车和山羊分别替换为自由和执行的蒙蒂霍尔问题。
问题
三名囚犯,A、B和C,被关在不同的牢房中并被判处死刑。州长随机选择了其中一名被赦免。监狱长知道哪一个被赦免了,但不能说出来。犯人A请求监狱长让他知道将要被处决的两个人之一的身份。“如果要赦免B,就给我C的名字。如果要赦免C,就给我B的名字。如果要赦免,偷偷掷硬币决定是B还是C。”
典狱长告诉A,B将被处决。犯人A很高兴,因为他认为他的生还机率从1/3上升到了1/2,就像现在他和C之间的情况一样。犯人A偷偷告诉C这个消息,谁认为A被赦免的机会是1/3不变,但他很高兴,因为他自己的机会上升到了2/3。哪个囚犯是正确的?
解决方案
答案是犯人A没有得到任何关于自己命运的信息,因为他已经知道监狱长会给他一个别人的名字。犯人A在听取监狱长的意见之前,估计他被赦免的机会为1/3,和B和C一样。正如典狱长所说的B将被处决,要么是因为C将被赦免(1/3机会),否则A将被赦免(1/3(__1/2机会;对于一个整体1/2×1/3=1/6机会B被命名是因为A将被赦免)。所以,听说B会被处死,A估计被赦免的机率是C的一半。这意味着他被赦免的机率,现在知道B没有,又是1/3,但C有一个2/3被赦免的机会。
桌子
上面的解释可以总结在下表中。由于A要求典狱长,他只能回答B或C被执行(或“不赦免”)。
被赦免典狱长:“不是B”典狱长:“不是C”和
一个1/61/61/3
乙01/31/3
C1/30⅓
由于监狱长已回答B不会被赦免,因此解决方案来自第二列“不是B”。似乎A与C被赦免的机率是1:2。
数学公式
称呼A,B和C相应囚犯将被赦免的事件,以及b如果监狱长告诉A囚犯B将被处决,那麽使用贝叶斯定理,A被赦免的后验概率是:
P(A|b)=P(b|A)P(A)P(b|A)P(A)+P(b|B)P(B)+P(b|C)P(C)=12×1312×13+0×13+1×13=13.
另一方面,C被赦免的概率是:
P(C|b)=P(b|C)P(C)P(b|A)P(A)+P(b|B)P(B)+P(b|C)P(C)=1×1312×13+0×13+1×13=23.
使A和C不相等的关键区别在于P(b|A)=12但P(b|C)=1.如果A被赦免,监狱长可以告诉AB或C将被处决,因此P(b|A)=12;而如果C被赦免,监狱长只能告诉AB已被处决,所以P(b|C)=1.
直观的解释
犯人A只有一个1/3赦免的机会。知道B或C是否会被处决并不会改变他的机会。在听说B将被处决后,犯人A意识到,如果他自己不能获得赦免,那隻能交给C。这意味着C有2/3的机会获得赦免。这堪比蒙蒂霍尔问题。
列举可能的情况
可能会出现以下情况:
A被赦免,监狱长提到B要被处决:1/3×1/2=1/6的案例
A被赦免,典狱长提到C将被处死:1/3×1/2=1/6的案例
B被赦免,监狱长提到C将被处死:1/3的案例
C被赦免,监狱长提到B要被处决:1/3的案例
根据典狱长随机选择的规定,在1/3在A被赦免的时间裡,有一个1/2机会他会说B和1/2有机会他会说C。这意味着总体而言,1/6的时间(1/3[A被赦免]×1/2[那个监狱长说B]),监狱长会说B,因为A会被赦免,并且1/6的时间(1/3[A被赦免]×1/2[那个监狱长说C])他会说C,因为A正在被赦免。这加起来总计1/3的时间(1/6+1/6)A正在被赦免,这是准确的。
现在很清楚,如果典狱长对A的回答是B(1/2在所有情况下),然后1/3在C被赦免并且A仍将被执行的时间(案例4),并且只有1/6A被赦免的时间(案例1)。因此C的机会是(1/3)/(1/2)=2/3和A是(1/6)/(1/2)=1/3.
这个问题的关键是监狱长可能不会透露将被赦免的囚犯的姓名。如果我们去掉这个要求,它可以用另一种方式证明原来的问题。这个例子中唯一的变化是囚犯A要求监狱长透露其他囚犯之一的命运(没有具体说明将被处决的人)。在这种情况下,监狱长掷硬币并选择B和C中的一个来揭示命运。案例如下:
A被赦免,典狱长说:B被处决(1/6)
被赦免的典狱长说:C处决(1/6)
B赦免,监狱长说:B赦免(1/6)
B赦免,典狱长说:C处决(1/6)
C赦免,典狱长说:B处决(1/6)
C赦免,典狱长说:C赦免(1/6)
每个场景都有一个1/6可能性。原来的三囚问题可以这样看:那个问题的典狱长还有这六个案例,每个案例都有一个1/6发生的概率。然而,原案中的典狱长无法透露被赦免的囚犯的命运。因此,以案例3为例,由于说“B被赦免”不是一个选项,监狱长改为说“C被执行”(使其与案例4相同)。这使得案例4和5各有一个1/3发生的概率,并给我们留下与以前相同的概率。
为什麽会出现悖论?
人们倾向于提供1/2的答案可能是由于倾向于忽略似乎没有影响的上下文。例如,如何向监狱长提出问题会影响答案。这可以通过考虑修改后的情况来证明,其中P(A)=14,P(B)=14,P(C)=12关于问题的其他一切都保持不变。再次使用贝叶斯定理:
P(A|b)=12×1412×14+0×14+1×12=15.
但是,如果A简单地询问B是否会被处决,而典狱长回答“是”,那麽A被赦免的概率变为:
P(A|b)=1×141×14+0×14+1×12=13.
类似的假设是A事先计划向监狱长询问此信息。如果A不打算向监狱长询问任何事情,而监狱长只是告诉他他将执行B,则会出现与上述类似的情况。[
另一个可能被忽视的假设是监狱长有一个概率选择。让我们定义p作为在C将被执行的情况下,监狱长将命名B的条件概率。条件概率P(A|b)则可以表示为:
P(A|b)=pp+1
如果我们假设p=1,也就是说,我们没有考虑到典狱长是在做一个概率性的选择,那麽P(A|b)=12.然而,问题的现实是监狱长在抛硬币(p=12),所以P(A|b)=13
JudeaPearl(1988)使用这个例子的一个变体来证明信念更新必须不仅取决于观察到的事实,而且还取决于导致这些事实的实验(即查询)。