字:
关灯 护眼
快眼看书 / 耶和华 / 69

69

章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。

  赌徒谬误
  赌徒谬误,也称为蒙特卡洛谬误或机会成熟谬误,是一种错误的信念,即如果某个特定事件在过去比正常情况更频繁地发生,那麽它在未来(或反之亦然),当已经确定此类事件的概率不取决于过去发生的事情时。此类事件具有历史独立性,称为统计独立性。谬误通常与赌博有关,例如,可以相信下一次掷骰子的概率比通常情况下要多为6,因为最近出现的6少于预期的数量。“蒙特卡洛谬误”一词源于该现象最着名的例子,它发生在1913年的蒙特卡洛赌场。
  例子
  掷硬币
  赌徒的谬误可以通过反复掷硬币来说明。不同投掷的结果在统计上是独立的,单次投掷正面朝上的概率为1/2(二分之一)。在两次投掷中得到两个正面的概率是1/4(四分之一),三次投掷中获得三个正面的概率为1/8(八分之一)。一般而言,如果Ai是抛硬币i出现正面的事件,则:
  Place(⋂i=1nAi)=∏i=1nPlace(Ai)=12n.
  如果连续抛四个正面后,下一次抛硬币也出现正面,则完成连续五个正面的运行。因为连续五个正面的概率是1/32(三十二分之一),一个人可能认为下一次翻转更有可能出现反面而不是再次出现正面。这是不正确的,是赌徒谬误的一个例子。“连续5次正面”事件和“前4次正面,然后是反面”事件的可能性相等,每个都有概率1/32.由于前四次投掷都是正面,因此下一次投掷是正面的概率为:
  Place(A5|A1∩A2∩A3∩A4)=Place(A5)=12.
  虽然连续五次正面朝上的概率为1/32=0.03125(略高于3%),误解在于没有意识到只有在第一枚硬币被抛之前才会出现这种情况。在本例中的前四次投掷之后,结果不再是未知的,因此它们在该点的概率等于1(100%)。一连串任意长度的硬币连续抛一次的概率总是0.5。第五次投掷更有可能是反面,因为前四次投掷是正面,过去的运气影响未来的机率,这一推理构成了谬误的基础。
  为什麽公平硬币的概率是1/2
  如果一枚公平的硬币被抛21次,21次正面朝上的概率是2,097,152分之一。在已经连续翻转20个头之后翻转一个头的概率是1/2.假设一个公平的硬币:
  20个正面,那麽1个尾巴的概率是0.5×0.5=0.5^21
  20个正面的概率,那麽1个正面是0.5×0.5=0.5^21
  得到20个正面然后1个反面的概率,以及得到20个正面然后另一个正面的概率都是2,097,152分之一。当掷一枚公平的硬币21次时,结果同样可能是21次正面和20次正面,然后是1次反面。这两个结果的可能性与可以从掷硬币21次中获得的任何其他组合的可能性相同。所有21次翻转组合的概率等于0.5或2,097,152中的1。假设由于先前翻转的结果而发生概率变化是不正确的,因为21翻转序列的每个结果都与其他结果一样可能。根据贝叶斯定理,每次翻转的可能结果是公平硬币的概率,即1/2.
  其他示例
  这种谬误导致错误的观念,即先前的失败会增加后续尝试的成功概率。对于一个公平的16面骰子,每个结果发生的概率是1/16(6.25%)。如果将胜利定义为掷出1,则16次掷中至少出现一次1的概率为:
  1-[1516]16=64.39%
  第一次失败的概率是15/16(93.75%)。根据谬误,玩家应该在发生一次失败后有更高的获胜机会。现在至少赢一场的概率是:
  1-[1516]15=62.02%
  投掷失败,玩家获胜的概率会下降两个百分点。剩下5次失败和11次掷骰,获胜的概率下降到0.5左右(50%)。在一系列失败之后,至少获胜的概率不会增加;事实上,成功的可能性实际上降低了,因为剩下的试验更少了。获胜的概率最终将等于单次投掷获胜的概率,即1/16(6.25%),当只剩下一次投掷时发生。
  反转位置
  在一致倾向于反面之后,赌徒也可能决定反面成为更有可能的结果。这是一个理性的贝叶斯结论,考虑到硬币可能不公平的可能性;这不是谬论。相信有利于反面的可能性,赌徒认为没有理由改为正面。然而,一系列试验带有对过去结果的记忆,而这些记忆往往有利于或不利于未来的结果,这是一种谬论。
  IanHacking描述的逆赌徒谬误是这样一种情况,赌徒进入房间并看到一个人在一对骰子上掷出双六,可能会错误地得出结论,这个人一定已经掷骰子很长时间了,因为他们会不太可能在第一次尝试时获得双六。
  回顾性赌徒谬误
  研究人员已经检查了基于已知后续事件推断未知过去事件是否存在类似的偏见,称其为“追溯赌徒谬误”。
  回顾性赌徒谬误的一个例子是观察硬币掷硬币的多个连续“正面”,并由此得出先前未知的翻转是“反面”的结论。回顾性赌徒谬误的真实世界例子被认为存在于诸如宇宙起源之类的事件中。在他的着作《宇宙》中,约翰·莱斯利认为“存在许多在其性格上截然不同的宇宙可能是我们对为什麽至少一个宇宙具有允许生命存在的性格的最佳解释”。丹尼尔·M·奥本海默和BenoîtMonin争辩说:“换句话说,对低概率事件的‘最佳解释’是它只是多次试验中的一次,这是逆向赌徒谬误的核心直觉。”关于这些论点是否是谬误的哲学争论正在进行中,他们认为我们宇宙的出现与其他宇宙的存在或宇宙的试验无关。三项涉及斯坦福大学学生的研究测试了回顾性赌徒谬误的存在。所有三项研究都得出结论,人们回顾性地以及对未来事件都有赌徒谬误。[2]所有三项研究的作者都得出结论,他们的发现具有重要的“方法学意义”,但也可能具有需要调查和研究的“重要理论意义”,并表示“对此类推理过程的透彻理解要求我们不仅要研究它们如何影响我们对未来的预测,也是我们对过去的看法。”
  1796年,皮埃尔-西蒙·拉普拉斯(Pierre-SimonLaplace)在《关于概率的哲学论文》中描述了男人计算生儿子概率的方式:在他们希望成为父亲的那一个月裡,想像每个月底这些孩子与女孩的出生比例应该相同,他们判断已经出生的男孩更有可能让女孩接下来出生。"准爸爸们担心,如果周围社区生出更多的儿子,那麽他们自己生女儿的可能性就更大。拉普拉斯的这篇文章被认为是对谬误的最早描述之一。
  在生了多个同性孩子之后,一些父母可能会认为他们应该生一个异性孩子。虽然Trivers-Willard假说预测出生性别取决于生活条件,指出更多的男孩出生在良好的生活条件下,而更多的女孩出生在较差的生活条件下,但生育任何性别的孩子的概率仍然是认为接近0.5(50%)。
  蒙特卡洛赌场
  赌徒谬误最着名的例子可能发生在1913年8月18日在蒙特卡洛赌场的轮盘赌游戏中,当时球连续26次变成黑色。这是一个非常罕见的事件:红色或黑色序列连续出现26次的概率为(18/37)或大约6660万分之一,假设机制是无偏的。赌徒在与黑色的赌注中损失了数百万法郎,错误地认为连续性导致轮盘随机性的不平衡,并且必须紧随其后的是一长串红色。
  非示例
  非独立事件
  当不同事件的概率不独立时,赌徒谬误不适用。在这种情况下,未来事件的概率可以根据过去事件的结果而改变,例如事件的统计排列。一个例子是从一副牌中抽出牌而没有更换。如果从一副牌中抽出一张A并且没有重新插入,则下一张抽出的牌不太可能是A,而更有可能是另一个等级。假设这是第一张抽到的牌并且没有小丑,则抽到另一张A的概率已从4/52(7.%)至3/51(5.88%),而彼此排名的概率从4/52(7.%)至4/51(7.84%)。这种效果允许纸牌计数係统在诸如二十一点的游戏中工作。
  偏见
  在赌徒谬误和反向赌徒谬误的大多数例子中,审判(例如掷硬币)被认为是公平的。在实践中,这个假设可能不成立。例如,如果一枚硬币被抛21次,则21次正面朝上的概率为2,097,152分之一。由于这种可能性很小,如果发生这种情况,很可能是硬币以某种方式偏向正面朝上,或者它被隐藏的磁铁或类似物控制。在这种情况下,明智的选择是“正面”,因为来自经验证据的贝叶斯推断——连续21次正面——表明硬币可能偏向正面。贝叶斯推理可以用来表明,当不同结果的长期比例未知但可交换的(意味着产生结果的随机过程可能有偏差,但同样可能在任何方向上都有偏差),并且先前的观察结果证明了偏差的可能方向,即在观察到的数据中出现最多的结果是最有可能再次发生的。
  例如,如果一个有偏见的硬币的先验概率是1%,假设这种有偏见的硬币正面朝上的概率是60%,那麽在21次正面朝上之后,有偏见的硬币的概率增加到大约32%。
  汤姆·斯托帕德(TomStoppard)的戏剧罗森克兰茨和吉尔登斯特恩已死的开场讨论了这些问题,一个人不断地转过头,另一个人考虑各种可能的解释。
  改变概率
  如果允许外部因素改变事件的概率,赌徒的谬误可能不成立。例如,游戏规则的改变可能有利于一名球员而不是另一名球员,从而提高他或她的胜率。同样,在对方球队了解并对抗他们的弱点后,缺乏经验的球员的成功率可能会降低。这是偏见的另一个例子。
  心理学
  起源
  赌徒的谬误源于对小数定律的信仰,导致错误地认为小样本必须代表更大的人口。根据谬误,条纹最终必须均匀才能具有代表性。阿莫斯·特沃斯基和丹尼尔·卡尼曼首先提出赌徒谬误是一种由称为代表性启发式的心理启发式产生的认知偏差,它指出人们通过评估某个事件与他们经历过的事件的相似程度来评估某个事件的概率之前,以及围绕这两个过程的事件有多相似。根据这种观点,“例如,在观察到轮盘赌上红色的长期运行后,大多数人错误地认为黑色会比出现额外的红色产生更具代表性的序列”,所以人们期望短期随机结果应该具有长期的特性,特别是与平均值的偏差应该平衡。当人们被要求组成一个看起来随机的抛硬币序列时,他们倾向于在任何短片段中做出比偶然预测的更接近于0.5的序列,这种现像被称为对样本不敏感大小。Kahneman和Tversky解释这意味着人们相信随机事件的短序列应该代表较长的随机事件。[聚类错觉的相关现象背后也引用了代表性启发式方法,根据这种情况,人们认为随机事件的条纹是非随机的,而这种条纹实际上比人们预期的更可能发生在小样本中。
  赌徒的谬误也可以归因于错误地认为赌博,甚至是机会本身,是一个公平的过程,可以在出现连胜的情况下自我纠正,这被称为公正世界假说。其他研究人员认为,对谬误的信念可能是对内部控制点的错误信念的结果。当一个人认为赌博结果是他们自己的技能的结果时,他们可能更容易受到赌徒谬误的影响,因为他们拒绝机会可以战胜技能或才能的想法。
  变化
  一些研究人员认为,可以定义两种类型的赌徒谬误:第一类和第二类。第一类是典型的赌徒谬误,个人认为在长期连续出现另一种结果之后会出现特定结果。由GideonKeren和CharlesLewis定义的第二类赌徒谬误发生在赌徒低估需要多少次观察才能发现有利结果时,例如长时间观看轮盘赌,然后押注出现最多的数字经常。对于具有高度随机性的事件,检测将导致有利结果的偏差需要花费不切实际的大量时间,而且即使不是不可能,也很难做到。这两种类型的不同之处在于,一种错误地假设赌博条件是公平和完美的,而第二种假设条件是有偏差的,并且这种偏差可以在一定时间后被检测到。
  另一种被称为回顾性赌徒谬误的变种发生在个人判断一个看似罕见的事件必须来自一个比更常见事件更长的序列时。当观察到一组三个六而不是只有两个六时,相信一个假想的掷骰序列是三倍多。这种效应可以在孤立的情况下观察到,甚至可以依次观察到。另一个例子是听说一个青少年在某个晚上发生了无保护性行为并怀孕了,并得出结论说她从事无保护性行为的时间比我们听说她有无保护性行为但没有怀孕的时间长,当成为每次**的结果怀孕是独立于先前**的量。[17]
  与热手谬误的关係
  另一种心理学观点认为,赌徒谬误可以看作是篮球热手谬误的对应物,在这种谬误中,人们倾向于预测与前一个事件相同的结果——称为正近因——导致相信高分者将继续分数。在赌徒谬误中,人们预测前一个事件的相反结果——负新近度——认为既然轮盘赌在前六次都落在黑色上,那麽下一次应该落在红色上。Ayton和Fischer的理论认为,人们对热手谬误表现出积极的新近度,因为该谬误涉及人类的表现,并且人们不相信无生命的物体会变得“热”。人类的表现并不被认为是随机的,当人们认为产生结果的过程是非随机的时,他们更有可能继续保持连续性。当一个人表现出赌徒谬误时,他们也更有可能表现出热手谬误,这表明一个构念对这两个谬误负责。
  这两种谬误的区别也体现在经济决策中。Huber、Kirchler和Stockl在2010年进行的一项研究调查了金融市场如何表现出热手和赌徒谬误。研究人员给他们的参与者一个选择:他们可以押註一系列抛硬币的结果,使用专家意见来左右他们的决定,或者选择无风险的替代方案以获得较小的经济回报。参与者在24%的情况下根据他们过去的成功经验求助于专家意见做出决定,这就是热手的例证。如果专家是正确的,则78%的参与者会再次选择专家的意见,而当专家错时,这一比例为57%。参与者还展示了赌徒的谬误,在註意到任一结果的连续性后,他们对正面或反面的选择会减少。这个实验有助于支持Ayton和Fischer的理论,即人们更相信人类的表现,而不是看似随机的过程。
  神经生理学
  虽然代表性启发式和其他认知偏差是赌徒谬误最常被引用的原因,但研究表明也可能存在神经学成分。功能性磁共振成像显示,在赌注或赌博失败后,称为风险损失,大脑的额顶叶网络被激活,导致更多的冒险行为。相反,杏仁核、尾状核和腹侧纹状体的活动减少在风险损失之后。杏仁核的激活与赌徒谬误呈负相关,因此杏仁核中表现出的活动越多,个人就越不可能成为赌徒谬误的牺牲品。这些结果表明,赌徒的谬误更多地依赖于负责执行、目标导向过程的前额叶皮层,而不是控制情感决策的大脑区域。
  继续赌博或下注的慾望由纹状体控制,纹状体支持选择结果权变学习方法。纹状体处理预测中的错误并相应地改变行为。获胜后,积极行为得到加强,失败后,行为被限制为避免。在表现出赌徒谬误的个体中,这种选择-结果权变方法受到损害,他们在一系列损失后继续冒险。
  可能的解决方案
  赌徒谬误是一种根深蒂固的认知偏见,很难克服。对个人进行关于随机性本质的教育并不总能有效地减少或消除谬误的任何表现。Beach和Swensson在1967年的一项研究中,参与者被展示了一副洗牌的索引卡片,上面有形状,并被要求猜测接下来会出现哪个形状。实验组参与者被告知赌徒谬误的性质和存在,并被明确指示不要依赖运行依赖来进行猜测。对照组没有得到这些信息。两组的反应风格相似,表明实验组仍然基于运行序列的长度进行选择。
  个人对赌徒谬误的敏感性可能会随着年龄的增长而降低。Fischbein和Schnarch在1997年的一项研究对五组进行了问卷调查:5、7、9、11年级的学生和专门教授数学的大学生。没有一个参与者之前接受过任何关于概率的教育。问的问题是:“罗尼掷硬币三次,每次都出现正面。罗尼打算再次掷硬币。第四次得到正面的机会是多少?”结果表明,随着学生年龄的增长,他们回答“小于得到尾巴的机会”的可能性越小,这表明了负面的新近效应。35%的五年级学生、35%的七年级学生和20%的九年级学生表现出负近因效应。只有10%的11年级学生会这样回答,而没有一个大学生会这样回答。Fischbein和Schnarch认为,个人倾向于依赖代表性启发式和其他认知偏见可以随着年龄的增长而克服。
  另一种可能的解决方案来自格式塔心理学家Roney和Trick,他们认为可以通过分组来消除谬误。当诸如抛硬币之类的未来事件被描述为序列的一部分时,无论多麽武断,人们都会自动认为该事件与过去事件相关,从而导致赌徒谬误。当一个人认为每个事件都是独立的,谬误可以大大减少。
  Roney和Trick在他们的实验中告诉参与者,他们赌的是两个掷硬币的块,每块6个硬币,或者赌两个块,每块7个硬币。第四次、第五次和第六次抛掷的结果都是一样的,要么是三个正面,要么是三个反面。第七次投掷与一个区块的结束或下一个区块的开始组合在一起。当第七次试验是第一个区块的一部分时,参与者表现出最强的赌徒谬误,直接在三个正面或反面的序列之后。研究人员指出,与选择赌徒谬误的参与者相比,没有表现出赌徒谬误的参与者对赌注的信心和下注次数更少。当第七次试验与第二次分组并被认为不是连续的一部分时,赌徒'
  Roney和Trick认为,与其教导个人随机性的本质,不如通过训练人们将每个事件视为一个开始而不是先前事件的延续来避免这种谬误。他们建议这将防止人们在输球时赌博,错误地希望他们获胜的机会是由于与以前事件的互动而增加的。
  用户类型
  在现实世界环境中,大量研究发现,对于处于高风险情景中的各种决策者,他们的判断很可能会反映出某种程度的强烈负自相关。
  庇护法官
  在一项旨在发现与赌徒谬误存在的负自相关是否存在于美国庇护法官做出的决定中的一项研究中,结果表明,在连续两次获得庇护后,法官批准第三次庇护的可能性会降低5.5%。
  棒球裁判
  在棒球比赛中,每分钟都在做出决定。裁判员做出的一项经常受到审查的特定决定是“打击区”决定。每当击球手没有摆动时,裁判员必须决定球是否在击球手的公平区域内,称为好球区。如果在这个区域之外,球不计入击球手的出局。在一项对超过12,000场比赛的研究中,结果表明,如果前两个球也是好球,裁判员宣布好球的可能性会降低1.3%。
  信贷员
  在信贷员的决策中,可以说金钱激励是决策有偏见的一个关键因素——这使得检验赌徒的谬误效应变得困难。然而,研究表明,如果信贷员为之前的客户批准贷款,那麽不受金钱收益激励的信贷员批准贷款的可能性会降低8%。
  彩票玩家
  彩票游戏和累积奖金吸引了全球的赌徒,对于有希望的赢家来说,最大的决定是选择什麽数字。虽然大多数人都会有自己的策略,但有证据表明,在当前抽奖中选择一个号码作为获胜者后,相同号码在下一次彩票中的选择将显着下降。CharlesClotfelter和PhilipCook的一项流行研究在1991年调查了这种影响,他们得出结论,投注者在被选中后将立即停止选择数字-最终在三个月内恢復选择受欢迎程度。不久之后,DekTerrell在1994年进行了一项研究,以测试Clotfelter和Cook的发现。Terrell研究中的关键变化是对pari-mutuel彩票,其中选择的总投注额较低的号码将导致较高的派彩。虽然这项检查确实得出结论,两种彩票的玩家都表现出符合赌徒谬误理论的行为,但那些参与彩池投注的人似乎受到的影响较小。
  表1.基于Clotfelter,Cook(1991)
  彩票玩家下注的金额
  1988年4月14日开出的号码抽奖日开奖后几天
  四月获胜者号码013756
  112444134242730
  125042920121815
  137182820171925
  1432313495798176
  156401020181620
  169573022202432
  之前选择的玩家的平均百分比
  中奖号码与开奖日期相比
  78%63%68%73%
  可以观察到赌徒谬误的影响,因为数字在被选为赢家后不久被选择的频率要低得多,在两个月内缓慢恢復。例如,1988年4月11日,41名玩家选择了244作为获胜组合。三天后,只有24个人选择了244,减少了41.5%。这是赌徒的谬误,因为彩票玩家认为在前几天出现的中奖组合会降低今天出现的可能性。
  视频游戏玩家
  一些视频游戏使用了战利品盒,这是一种在打开时奖励的游戏内物品的集合,其中包含由稀有度指标设置的随机内容,作为一种货币化方案。自2018年左右以来,战利品箱一直受到政府和倡导者的审查,因为它们类似于赌博,尤其是针对青少年的游戏。一些游戏使用特殊的“可怜计时器”机制,如果玩家连续打开多个战利品箱而没有获得高稀有物品,随后的战利品箱将提高更高机率物品掉落的机率。这被认为助长了赌徒的谬误,因为它强化了玩家在仅从一系列先前的战利品箱中获得普通物品后最终将获得高稀有物品(获胜)的想法。
  主悖论
  在统计学中,洛德悖论提出了何时适合控制基线状态的问题。在三篇论文中,FredericM.Lord举例说明了统计学家是否可以根据是否调整预先存在的差异得出不同的结论。Holland&Rubin(1983)使用这些示例来说明数据中如何可能存在多个有效的描述性比较,但因果结论需要一个潜在的(不可检验的)因果模型。
  洛德悖论最着名的表述来自他1967年的论文:
  “一所大型大学有兴趣调查大学食堂提供的饮食对学生的影响以及这些影响中的任何性别差异。收集了各种类型的数据。特别是,每个学生在九月到达时的体重和次年六月的体重都会被记录下来。”(Lord1967,第304页)
  在9月和6月,男性体重的总体分佈是相同的,儘管个体的体重发生了变化,女性体重的分佈也是如此。
  Lord想像了两个使用不同的常用统计方法但得出相反结论的统计学家。
  一位统计学家不调整初始体重,而是使用方差分析(ANOVA)并比较增益分数(个人的平均最终体重-平均初始体重)作为结果。第一位统计学家声称性别之间没有显着差异:“[A]就这些数据而言,没有证据表明饮食(或其他任何东西)对学生体重有任何有趣的影响。特别是,没有证据表明对两种性别的任何差异影响,因为两组都没有显示出任何系统性变化。”(第305页)从视觉上看,第一位统计学家发现两组均值(“A”和“B”)均未发生变化,并得出结论认为新饮食没有因果影响。
  第二位统计学家使用协方差分析(ANCOVA)调整初始权重,并比较(调整后的)最终权重作为结果。他发现两个食堂之间存在显着差异。从视觉上看,第二位统计学家拟合了一个回归模型(绿色虚线),发现男孩与女孩的截距不同,并得出结论,新饮食对男性的影响更大。
  回应
  对于这个悖论,以及它与其他统计悖论的关係,已经有很多尝试和解释。虽然最初被认为是一个悖论,但后来的作者已经使用这个例子来阐明不可检验假设在因果推理中的重要性。
  建模假设的重要性
  博克(1975)
  博克对这个悖论做出了回应,他假设一旦提出的问题得到澄清,场景中的两位统计学家都是正确的。第一个统计学家(比较组均值和分佈)问“平均体重增加有差异吗?”,而第二个是问“个体体重增加有什麽差异?”
  考克斯和麦卡拉(1982)
  Cox和McCullagh通过构建一个模型来解释这个问题,即如果学生不在食堂用餐会发生什麽,他们假设学生的体重会保持不变。他们得出的结论是,事实上,第一个统计学家在询问群体差异时是正确的,而第二个在询问对个人的影响时是正确的。
  荷兰和鲁宾(1983)
  Holland&Rubin(1983)认为,两位统计学家都捕捉到了数据的准确描述性特徵:统计学家1准确地发现两种性别的相对体重变化没有差异,而统计学家2准确地发现男孩有条件的平均体重增加更大男孩和女孩的起始体重相同。然而,当将这些描述转化为因果陈述时,他们隐含地断言,否则权重将保持不变(统计学家1)或者它会遵循假定的线性模型(统计学家2)。
  “总而言之,我们认为以下观点解决了主悖论。如果两位统计学家都只做出描述性陈述,那麽他们都是正确的。统计学家1做出无条件的描述性陈述,即男性和女性的平均体重增加是相等的;统计学家2做出有条件的(在X上)陈述,即对于9月体重相同的男性和女性,男性获得的收益比女性多。相反,如果统计学家将这些描述性陈述变成因果陈述,那麽两者都不会正确或不正确,因为不可检验的假设决定了因果陈述的正确性……统计学家1是错误的,因为他做出了因果陈述而没有指定做出它所需的假设真的。统计学家2更加谨慎,因为他只做出描述性陈述。然而,
  此外,将描述性陈述转化为因果性陈述所必需的基本假设是不可检验的。与描述性陈述不同(例如“美国的平均身高是X”),因果性陈述涉及对发生的事情和将会发生的事情进行比较在没有乾预的情况下发生。后者在现实世界中是不可观察的,Holland&Rubin将这一事实称为“因果推理的基本问题”(第10页)。这解释了为什麽研究人员经常求助于实验:虽然我们仍然从未观察到单个主题的两种反事实,但实验让我们在最小的假设下对人口中的这些差异做出统计声明。如果没有实验,建模者应该仔细描述他们用来做出因果陈述的模型,并儘可能有力地证明这些模型的合理性。
  作为中介的初始权重
  Pearl(2016)详细阐述了先前的批评,以说明为什麽所谓的“悖论”起初看起来令人惊讶,并认为两位研究人员实际上都可以测量有效(但不同)的因果量。为了专注于男孩和女孩之间的比较,他认为性是感兴趣的“治疗”。
  首先,Pearl描述了为什麽结果一开始看起来令人惊讶:儘管在初始体重的每个层次中,男性和最终体重之间存在正相关,但当每个体重层次平均在一起时,似乎没有差异。因此,这个谜题与辛普森悖论密切相关,并且具有相同的解决方案:当层级大小不同时,统计关联可能会在聚合时消失或反转。
  其次,Pearl提出了一个因果DAG来描述这种情况,即性别和初始体重都会影响最终体重。这将初始体重作为一个中介变量:性别通过直接效应和间接效应(通过影响初始体重,然后影响最终体重)影响最终体重。请注意,这些变量都不是混杂因素,因此在此模型中控制不是绝对必要的。然而,是否控制初始权重的选择决定了研究人员测量的是哪种效应:第一个统计学家不控制并测量总效应,而第二个统计学家控制并测量一个总效应。直接影响。
  “总效应和直接效应在符号上不同的情况很常见。例如,当接种天花具有致命反应的风险时,我们一点也不感到惊讶,但通过根除天花降低了总体死亡率。在这种情况下,直接效应(致命反应)是对人口的每个阶层都是负面的,但对整个人口的总体影响(对死亡率)是积极的。”(第4页)
  Tu,Gunnell和Gilthorpe(2008)使用了类似的因果框架,但反驳说,直接效应和总效应的概念化在许多情况下并不是最好的框架,因为可以控制许多不同的变量,而没有实验基础这些是独立的因果路径。
  与其他悖论的关係
  根据Tu、Gunnell和Gilthorpe的说法,洛德悖论是辛普森悖论的连续版本。这些作者指出,洛德悖论、辛普森悖论和不相关的预测变量对协变量的抑制都是一回事,即逆转悖论。
  重要性
  从广义上讲,“因果推理的基本问题”和相关的聚合概念辛普森悖论在应用统计学中发挥着重要作用。Lord'sParadox和相关分析为理解这些基本统计概念提供了强大的教学工具。
  更直接地说,洛德悖论可能对教育和卫生政策产生影响,这些政策试图奖励教育工作者或医院,因为他们的孩子/患者在他们的照顾下取得了进步,这是不让一个孩子掉队的基础。[9]它也被怀疑在将智商与眼睛缺陷联繫起来的研究中起作用。
  斯坦的例子
  在决策理论和估计理论中,斯坦因的例子(也称为斯坦因现像或斯坦因悖论)是观察到,当同时估计三个或更多参数时,存在平均更准确的组合估计量(即具有较低的期望均方误差)比任何单独处理参数的方法都要好。它以斯坦福大学的查尔斯·斯坦命名,他在1955年发现了这一现象。
  一个直观的解释是,优化组合估计器的均方误差与优化单个参数的单独估计器的误差不同。实际上,如果实际上对组合误差感兴趣,则应使用组合估计器,即使基础参数是独立的。如果一个人对估计单个参数感兴趣,那麽使用组合估计器没有帮助,实际上更糟。
  正式声明
  以下是悖论的最简单形式,即观察数等于要估计的参数数的特殊情况。让θ是一个由以下组成的向量n≥3未知参数。为了估计这些参数,单次测量Xi对每个参执行θi,得到一个长度为C的向量n.假设已知测量值是独立的高斯随机变量,均值θ和方差1,IE,X~ñ(θ,In).因此,每个参数都是使用单个噪声测量来估计的,并且每个测量同样不准确。
  在这些条件下,将每个测量值用作其相应参数的估计值是直观且常见的。这个所谓的“普通”决策规则可以写成θ^=X,这是最大似然估计(MLE)。这种估计器的质量是通过其风险函数来衡量的。一个常用的风险函数是均方误差,定义为B[‖θ-θ^‖2].令人惊讶的是,“普通”决策规则在均方误差方面是次优的(不可接受的):n≥3.换句话说,在此处讨论的设置中,存在替代估计器,它们总是实现较低的均方误差,无论θ是。对于给定的θ显然可以定义一个完美的“估计器”,它总是θ,但这个估计量对θ.
  斯坦因悖论的估计量是,对于给定的θ,优于“普通”决策规则X对于一些X但对其他人来说必然更糟。平均而言,它们更好。更准确地说,估计器θ^1据说支配另一个估计器θ^2如果,对于所有值θ,的风险θ^1低于或等于风险θ^2,如果不等式对某些人来说是严格的θ.如果没有其他估计量支配一个估计量,则称该估计量是可接纳的,否则是不可接纳的。因此,斯坦因的例子可以简单地表述如下:在均方误差风险下,多元高斯分佈均值的“普通”决策规则是不可接受的。
  许多简单实用的估计器比“普通”决策规则获得更好的性能。最着名的例子是James-Stein估计器,它收缩X向特定点(例如原点)移动与距离成反比的量X从那时起。有关此结果证明的草图,请参阅Stein示例的证明。另一个证明归功于拉里布朗:他证明了n维多元正态平均向量当且仅当n维布朗运动是循环的。由于布朗运动对于n≥3,MLE不可用于n≥3.
  直观的解释
  对于任何特定的值θ新的估计器将改善至少一个个体均方误差B[(θi-θ^i)2].这并不难-例如,如果θ介于-1和1之间,并且σ=1,然后是线性收缩的估计量X向0靠0.5(即,符号⁡(Xi)最大限度(|Xi|-0.5,0),带阈值的软阈值0.5)的均方误差低于X本身。但还有其他价值θ这个估计量比X本身。Stein估计器和其他产生Stein悖论的方法的诀窍在于,它们以这样一种方式调整偏移,即始终存在(对于任何θ矢量)至少一个Xi其均方误差得到改善,并且其改进足以补偿可能发生在另一个方面的均方误差的任何下降θ^i.麻烦的是,不知不觉θ,你不知道哪个n均方误差得到改善,因此您不能仅对这些参数使用Stein估计器。
  上述设置的一个例子出现在电信中的信道估计中,例如,因为不同的因素会影响整体信道性能。
  影响
  Stein的例子令人惊讶,因为“普通”决策规则是直观且常用的。事实上,估计量构建的众多方法,包括最大似然估计、最佳线性无偏估计、最小二乘估计和最优等变估计,都导致了“普通”估计量。然而,如上所述,这个估计器是次优的。
  例子
  为了证明Stein示例的不直观性,请考虑以下真实示例。假设我们要估计三个不相关的参数,例如1993年美国的小麦产量、2001年温布尔登网球锦标赛的观众人数以及从超市随机选择的糖果棒的重量。假设我们对这些量中的每一个都有独立的高斯测量。Stein的例子现在告诉我们,我们可以通过同时使用三个不相关的测量来更好地估计(平均)三个参数的向量。
  乍一看,我们似乎可以通过测量其他一些不相关的统计数据(例如温布尔登的观众人数和糖果棒的重量)以某种方式更好地估计美国小麦产量。然而,我们本身并没有获得更好的美国小麦产量估计量,但我们已经为所有三个随机变量的均值向量生成了一个估计量,这降低了总风险。这是因为向量的一个分量中的错误估计的成本被另一个分量中的更好估计所补偿。此外,使用新估计器获得的三个估计平均值的特定集合不一定比普通集合(测量值)更好。平均而言,新的估计器更好。
  斯坦因例子的证明
  斯坦因的例子是决策理论的一个重要结果,可以表述为
  在维度至少为3的均方误差风险下,用于估计多元高斯分佈均值的普通决策规则是不可接受的。
  以下是其证明的概要。更多信息请参阅主要文章。
  草图证明
  决策规则的风险函数d(X)=X是
  R(θ,d)=Eθ⁡[|θ−X|2]
  =∫(θ−x)T(θ−x)(12π)n/2e(−1/2)(θ-X)T(θ-X)M(dX)
  =n.
  现在考虑决策规则
  d'(X)=X-α|X|2X
  在哪裡α=n-2.我们将证明d'是更好的决策规则d.风险函数为
  R(θ,d')=Eθ⁡[|θ−X+α|X|2X|2]
  =Eθ⁡[|θ-X|2+2(θ-X)Tα|X|2X+α2|X|4|X|2]
  =Eθ⁡[|θ-X|2]+2αEθ⁡[(θ−X)TX|X|2]+α2Eθ⁡[1|X|2]
  —二次方α.我们可以通过考虑一般的“良好行为”函数来简化中间项H:X↦H(X)∈R并使用分部集成。为了1≤i≤n,对于任何连续可微H对于大的增长足够缓慢Xi我们有:
  Eθ⁡[(θi−Xi)h(X)|Xj=xj(j≠i)]=∫(θi−xi)h(x)(12π)n/2e−(1/2)(x−θ)T(x-θ)M(dXi)
  =[H(x)(12π)n/2e−(1/2)(x−θ)T(x−θ)]xi=−∞∞−∫∂h∂xi(x)(12π)n/2e−(1/2)(x−θ)T(x−θ)m(dxi)
  =-Eθ⁡[∂H∂Xi(X)|Xj=Xj(j≠i)].
  所以,
  Eθ⁡[(θi−Xi)h(X)]=−Eθ⁡[∂h∂xi(X)].
  (这个结果被称为斯坦引理。)
  现在,我们选择
  H(X)=Xi|X|2.
  如果H满足“表现良好”的条件(它没有,但这可以补救——见下文),我们会
  ∂H∂Xi=1|X|2-2Xi2|X|4
  所以
  Bθ⁡[(θ-X)TX|X|2]=∑i=1nEθ⁡[(θi−Xi)Xi|X|2]
  =-∑i=1nEθ⁡[1|X|2−2Xi2|X|4]
  =-(n-2)Bθ⁡[1|X|2].
  然后回到风险函数d':
  R(θ,d')=n-2α(n-2)Bθ⁡[1|X|2]+α2Bθ⁡[1|X|2].
  这个二次方在α最小化在
  α=n-2,
  给予
  R(θ,d')=R(θ,d)-(n-2)2Bθ⁡[1|X|2]
  这当然满足
  R(θ,d')<R(θ,d).
  製造d不可接受的决定规则。
  仍有理由使用
  H(X)=X|X|2.
  这个函数不是连续可微的,因为它是奇异的X=0.然而,函数
  H(X)=Xε+|X|2
  是连续可微的,并且在遵循代数通过并让ε→0,得到相同的结果。
  100名囚犯问题
  100名囚犯问题是概率论和组合学中的一个数学问题。在这个问题中,100个编号的囚犯必须在100个抽屉中的一个中找到自己的编号才能生存。规则规定,每个囚犯只能打开50个抽屉,并且不能与其他囚犯交流。乍一看,情况似乎毫无希望,但一个聪明的策略为囚犯提供了一个现实的生存机会。
  丹麦计算机科学家PeterBroMiltersen在2003年首次提出了这个问题。
  问题
  100名囚犯问题在文献中有不同的表述。以下版本由PhilippeFlajolet和RobertSedgewick编写:[1]
  监狱长为100名死囚提供最后的机会,他们的编号从1到100。一个房间包含一个有100个抽屉的橱柜。主任在每个封闭的抽屉裡随机放一个囚犯的号码。囚犯们一个接一个地进入房间。每个囚犯可以按任意顺序打开并查看50个抽屉。抽屉随后再次关闭。如果在这次搜查中,每个囚犯都在其中一个抽屉裡找到了他们的号码,那麽所有囚犯都会被赦免。如果只有一名囚犯找不到他们的号码,所有囚犯都会死亡。在第一个囚犯进入房间之前,囚犯们可能会讨论策略——但一旦第一个囚犯进入查看抽屉,他们就可能不会交流。囚犯的最佳策略是什麽?
  如果每个囚犯随机选择50个抽屉,则单个囚犯找到它们的概率为50%。因此,所有囚犯找到他们的号码的概率是单个概率的乘积,即(1/2)100≈0.0000000000000000000000000000008,一个微乎其微的数字。情况似乎没有希望了。
  解决方案
  战略
  令人惊讶的是,有一种策略可以提供超过30%的生存概率。成功的关键是囚犯不必事先决定打开哪些抽屉。每个囚犯都可以使用从他们已经打开的每个抽屉的内容中获得的信息来决定下一个打开哪个抽屉。另一个重要的观察是,这样一个囚犯的成功并不独立于其他囚犯的成功,因为它们都取决于数字的分佈方式。
  为了描述策略,不仅囚犯,而且抽屉都从1到100编号;例如,从左上角的抽屉开始逐行。现在的策略如下:
  每个囚犯首先打开标有自己号码的抽屉。
  如果此抽屉包含它们的编号,则它们已完成并成功。
  否则,抽屉裡有另一个囚犯的号码,他们接下来打开标有这个号码的抽屉。
  囚犯重複步骤2和3,直到他们找到自己的号码,或者因为在前50个打开的抽屉中找不到号码而失败。
  通过从他们自己的号码开始,囚犯保证他们处于包含他们号码的抽屉的唯一排列循环(见下文)中。唯一的问题是这个週期是否超过五十个抽屉。
  例子
  这是一个有前途的策略的原因通过以下示例说明,使用8个囚犯和抽屉,每个囚犯可以打开4个抽屉。监狱长按以下方式将囚犯的编号分配到抽屉中:
  抽屉数量12345678
  囚犯人数74681352
  囚犯现在的行为如下:
  犯人1首先打开抽屉1,找到7号。然后他们打开7号抽屉,找到5号。然后他们打开5号抽屉,找到自己的号码并成功。
  囚犯2按此顺序打开抽屉2、4和8。在最后一个抽屉裡,他们找到了自己的号码,2。
  囚犯3打开抽屉3和6,他们在其中找到了自己的号码。
  囚犯4打开抽屉4、8和2,他们在其中找到了自己的号码。这与囚犯2遇到的循环相同,囚犯8也会遇到。这些囚犯中的每一个都将在第三个打开的抽屉中找到自己的编号。
  5到8号囚犯也将以类似的方式找到他们的号码。
  在这种情况下,所有囚犯都会找到他们的号码。然而,情况并非总是如此。例如,交换抽屉5和8的数量的微小变化会导致囚犯1在打开1、7、5和2后失败(并且找不到自己的号码):
  抽屉数量12345678
  囚犯人数74682351
  在下面的安排中,囚犯1打开了抽屉1、3、7和4,此时他们必须停止失败:
  抽屉数量12345678
  囚犯人数31758642
  事实上,除了6名(直接成功)之外的所有囚犯都失败了。
  置换錶示
  监狱长将囚犯编号分配给抽屉在数学上可以描述为数字1到100的排列。这种排列是从1到100的自然数集与其自身的一对一映射。在重複应用排列后返回到第一个数字的数字序列称为排列的循环。每个排列都可以分解为不相交的循环,即没有共同元素的循环。上面第一个例子的排列可以用循环表示法写成
  (175)(248)(36)
  因此由两个长度为3的循环和一个长度为2的循环组成。因此,第三个例子的排列是
  (1374582)(6)
  并且由长度为7的循环和长度为1的循环组成。循环表示法不是唯一的,因为长度为循环l可以写成l不同的方式取决于循环的起始次数。在上述策略中打开抽屉的过程中,每个囚犯都遵循一个循环,该循环始终以自己的编号结束。在八名囚犯的情况下,当且仅当排列的最长循环的长度最多为4时,这种循环跟踪策略是成功的。如果一个排列包含长度为5或更长的循环,则所有编号位于这样的循环不要经过四步达到自己的数量。
  成功的概率
  在最初的问题中,如果排列的最长循环的长度最多为50,则100名囚犯是成功的。因此,他们的生存概率等于数字1到100的随机排列不包含长度更大的循环的概率大于50。这个概率在下面确定。
  数字1到100的排列最多可以包含一个长度循环l>50.正好有(100l)选择这样一个循环的数量的方法(参见组合)。在这个週期内,这些数字可以排列成(l-1)!方法,因为有l表示不同长度循环的排列l因为循环对称。剩馀的数字可以排列成(100-l)!方法。因此,数字1到100以长度为周期的排列数l>50等于
  (100l)⋅(l-1)!⋅(100-l)!=100!l.
  使用单个事件的公式和互补事件的公式计算(均匀分佈的)随机排列不包含长度大于50的循环的概率,因此由下式给出
  1-1100!(100!51+…+100!100)=1−(151+…+1100)=1−(H100−H50)≈0.31183,
  在哪裡Hn是个n-次谐波数。因此,使用循环跟踪策略,囚犯在令人惊讶的31%的案例中倖存下来。
  渐近线
  如果2n而不是考虑100名囚犯,其中n任意自然数,使用循环跟踪策略的囚犯的生存概率由下式给出
  1-(H2n-Hn)=1-(H2n-ln⁡2n)+(Hn-ln⁡n)-ln⁡2.
  欧拉-马斯切罗尼常数γ,为了n→∞
  limn→∞(Hn-ln⁡n)=γ
  成立,这导致渐近生存概率
  limn→∞(1-H2n+Hn)=1-γ+γ-ln⁡2=1-ln⁡2≈0.30685。
  由于概率序列是单调递减的,因此在超过30%的情况下,无论囚犯数量如何,囚犯都能通过循环跟踪策略存活下来。
  最优性
  2006年,EugeneCurtin和MaxWarshauser证明了循环跟踪策略的最优性。该证明基于一个相关问题的等价性,在该问题中,所有囚犯都被允许出现在房间内并观察抽屉的打开情况。在数学上,这种等价是基于Foata的转换引理,(规范)循环表示法和排列的单行表示法的一一对应。在第二个问题中,生存概率与所选择的策略无关,并且等于原始问题中使用循环跟踪策略的生存概率。由于原始问题的任意策略也可以应用于第二个问题,但在那裡无法获得更高的生存概率,因此循环跟踪策略必须是最优的。
  历史
  2003年,丹麦计算机科学家PeterBroMiltersen首次考虑了100名囚犯问题,他与AnnaGál在30.自动机、语言和编程国际讨论会(ICALP)的会议记录中发表了该问题。在他们的版本中,玩家A(监狱长)随机将带有B队(囚犯)玩家姓名的纸条涂成红色或蓝色,然后将每条纸条放入不同的盒子中。有些框可能是空的(见下文)。B队的每个玩家必须在打开一半的盒子后正确猜出自己的颜色才能获胜。最初,米尔特森假设随着玩家数量的增加,获胜概率很快趋于零。然而,奥尔胡斯大学Miltersen的同事SvenSkyum将他的注意力转移到了针对没有空盒子的这个问题的情况下的循环跟踪策略。找到这个策略在出版物中作为练习保留了下来。该论文荣获最佳论文奖。
  2004年春天,这个问题出现在JoeBuhler和ElwynBerlekamp的季刊TheEmissaryoftheMathematicalSciencesResearchInstitute的谜题专栏中。因此,作者用ROM替换了盒子,用签名替换了彩色纸条数字。作者指出,在团队成员找不到自己的号码的情况下,也可以提高获胜概率。如果给定的答案是所有找到的符号的乘积,并且如果最长循环的长度是玩家人数的一半(偶数)加一,那麽这个循环中的团队成员要么都猜错了,要么都猜对了。即使这种策略的扩展为少数玩家提供了明显的改进,但当玩家数量变大时,它就变得可以忽略不计了。
  在接下来的几年裡,这个问题进入了数学文献,并以不同的方式形成,例如桌子上的卡片或储物柜中的钱包(储物柜拼图)。2006年,ChristophPöppe在SpektrumderWissenschaft杂誌上和PeterWinkler在大学数学杂誌上提出了囚犯问题的形式。PhilippeFlajolet、RobertSedgewick和RichardP.Stanley在他们的组合学教科书中採用了这种形式。[1][3]
  变体
  空盒子编辑
  起初,Gál和Miltersen在他们的论文中考虑了这样一种情况,即盒子的数量是团队成员数量的两倍,而一半的盒子是空的。这是一个更困难的问题,因为空盒子无处可去,因此无法应用循环跟踪策略。在这种情况下,随着团队成员数量的增加,获胜概率是否趋于零是一个悬而未决的问题。
  2005年,NavinGoyal和MichaelSaks为B团队开发了一种基于循环跟踪策略的策略,以解决更普遍的问题,其中空盒子的比例以及每个团队成员被允许打开的盒子的比例是可变的。在这种情况下,获胜概率仍然趋于零,但比Gál和Miltersen建议的要慢。如果团队成员的数量和打开的盒子的比例是固定的,那麽当添加更多的空盒子时,获胜概率严格保持大于零。
  DavidAvis和AnneBroadbent在2009年考虑了一种量子理论变体,其中B队肯定会获胜。
  恶意导演
  如果监狱长不必将数字随机分配到抽屉中,并且意识到囚犯可能会採用上述策略并猜测囚犯将应用的盒子编号(例如盒子上标明的数字),他们可以阻止策略。为此,他们只需要确保他们将囚犯编号分配给抽屉构成一个长度大于50的循环的排列。反过来,囚犯可以通过在他们之间就特定的抽屉随机编号达成一致来解决这个问题,前提是导演没有无意中听到这一点,或者在囚犯被允许进入之前没有费心通过替换方框中的数字来做出回应。
  一名囚犯可以做出一项改变
  如果一个囚犯可以先进入房间,检查所有箱子,然后交换两个箱子的内容,所有囚犯都将倖免于难。之所以如此,是因为任何长度大于50的循环都可以被破坏,因此可以保证所有循环的长度最多为50。
  任何找到他们号码的囚犯都是自由的
  在任何发现其编号的囚犯都是自由的变体中,给定随机排列的个人生存的预期概率如下:
  没有策略:12
  使用原始问题的策略:(1-ln⁡(2))⋅1+∑k=⌊n/2⌋+1N1k(1−kn)=1−ln⁡(2)+∑⌊n/2⌋+1N1k−∑k=⌊n/2⌋+1N1n=1−ln⁡(2)+ln⁡(2)−12=12
  值得注意的是,儘管我们收到相同的期望值,但它们来自非常不同的分佈。使用第二种策略,某些囚犯在特定排列下注定会死或活,而使用第一种策略(即没有策略),每个排列都有“真正”的1/2机会。
  蒙蒂霍尔问题
  2009年,AdamS.Landsberg提出了以下100名囚犯问题的更简单变体,该变体基于着名的蒙蒂霍尔问题:
  在三扇紧闭的门后,一辆汽车,车钥匙和一隻山羊随机分佈。有两个玩家:第一个玩家必须找到汽车,第二个玩家必须找到汽车的钥匙。只有当两个玩家都成功时,他们才能将车开回家。第一个玩家进入房间,可以连续打开三扇门中的两扇。如果他们成功了,门会再次关闭,第二个玩家进入房间。第二个玩家也可以打开三扇门中的两个,但他们不能以任何形式与第一个玩家交流。如果两个玩家都採取最佳行动,获胜的概率是多少?
  如果玩家随机选择他们的门,获胜概率只有4/9(约44%)。然而,最佳策略如下:
  玩家1首先打开门1。如果车在门后,则玩家成功。如果钥匙在门后,玩家接下来打开门2;如果山羊在门后,则玩家接下来打开门3。
  玩家2首先打开门2。如果钥匙在门后面,则玩家成功。如果山羊在门后,则下一个玩家打开门3;而如果汽车在门后,则玩家接下来打开门1。
  在三扇门后的汽车、钥匙和山羊的六种可能分佈中,玩家打开以下门(在绿色情况下,玩家成功):
  汽车−钥匙−山羊汽车-山羊-钥匙钥匙-汽车-山羊钥匙-山羊-汽车山羊-汽车-钥匙山羊-钥匙-汽车
  玩家1门1:汽车门1:汽车门1:钥匙
  门2:汽车门1:钥匙
  门2:山羊门1:山羊
  门3:钥匙门1:山羊
  门3:汽车
  玩家2门2:钥匙门2:山羊
  门3:钥匙门2:
  车门1:钥匙(门2:山羊)
  (门3:汽车)(门2:汽车)
  (门1:山羊)门2:钥匙
  策略的成功是建立在两个参与者的成功和失败之间建立关联的基础上的。在这裡,获胜概率是2/3,这是最优的,因为第一个玩家不可能有比这更高的获胜概率。在进一步的变体中,三个奖品隐藏在三个门后面,三个玩家必须通过两次尝试独立地找到分配给他们的奖品。在这种情况下,获胜概率也是2/3当採用最优策略时。
  利特尔伍德定律
  利特尔伍德定律指出,一个人可以预期以大约每月一次的速度经历百万分之一的事件(称为“奇蹟”)。它是由英国数学家约翰·埃登索·利特尔伍德设计的。
  历史
  该法由剑桥大学教授约翰·埃登索·利特尔伍德製定,并发表在他1986年的作品集《数学家的杂记》中。它试图揭穿假定的超自然现象学的一个要素,并与真正大数的更一般定律有关,该定律指出,如果样本量足够大,任何离谱的事情(就单个样本的概率模型而言)都是可能发生。
  描述
  利特尔伍德将奇蹟定义为以百万分之一的频率发生的具有特殊意义的特殊事件。他假设在一个人清醒和警觉的几个小时内,一个人每秒会看到或听到一个“事件”,这可能是异常的或非异常的。此外,Littlewood假设人类每天保持警觉大约8小时。
  结果,在这些假设下,人类将在35天内经历大约一百万次事件。接受这个奇蹟的定义,人们可以期望平均每35天观察一次奇蹟事件——因此,根据这个推理,看似奇蹟的事件实际上是司空见惯的。
  西格尔悖论
  西格尔悖论是这样一种现象,即未来价格的不确定性在理论上可以促使理性消费者暂时将其偏好的消费品(或货币)换成非偏好的商品(或货币),作为交易回偏好消费品的计划的一部分。在价格变得清晰之后。例如,在某些模型中,美国人可以期望通过投资欧元平均赚取更多美元,而欧洲人可以期望通过投资美元平均赚取更多欧元。经济学家杰里米·西格尔在1972年发现了这个悖论。
  就像相关的两个信封问题一样,这种现像有时被称为悖论,因为代理人似乎可以交易具有相同货币价值的东西,但矛盾的是,似乎同时从交易中获得了货币价值。更仔细的分析表明,交易的“货币价值”是模棱两可的,但根据情况,这种交易通常是有利的。
  苹果/橙色示例
  经济学家FischerBlack在1995年给出了以下说明。假设一个消费者偏爱苹果的“苹果”国家和一个消费者偏爱有价值橙子的“橙”国家之间的汇率目前为1:1,但明年将变为2:1或1:2的概率相等。假设苹果消费者将苹果与橙子消费者交易以换取橙子。苹果消费者现在已经放弃了一个苹果来换取一个橙子,明年该橙子的预期价值为1.25个苹果。橙子消费者现在已经放弃了一个橙子来换取一个苹果,明年苹果的预期价值为1.25个橙子。因此,平均而言,两者似乎都从交换中受益。在数学上,表观盈馀与Jensen不等式有关。
  葡萄酒示例
  葡萄酒示例
  一个更详细的例子是一个简化的有效市场,有两种葡萄酒,一种美国葡萄酒和一种德国葡萄酒。11月,葡萄酒的交易比例为1:1。12月,大多数消费者对时尚葡萄酒的重视程度将是非时尚葡萄酒的两倍;任何一种葡萄酒都有50/50的机会在12月成为流行酒。因此,这些葡萄酒在12月的交易比例为1:2或2:1。大多数消费者只关心国籍,因为它会影响哪种葡萄酒是流行的。唯一的例外是一个忠诚的美国消费者,他只喝美国葡萄酒,对潮流漠不关心;还有一个忠诚的德国消费者,他只喝德国葡萄酒,同样对潮流漠不关心。
  与直觉相反,美国忠诚者更喜欢在11月持有德国而不是美国葡萄酒,因为它有50%的机会可以交易0.5种美国葡萄酒,并且有50%的机会可以交易2种美国葡萄酒,因此预期值为1.25美国葡萄酒。(这种情况下的所有消费者都是风险中性的)。同样,如果德国人持有美国葡萄酒,则可以认为拥有1.25的预期价值德国葡萄酒。在这种情况下,西格尔悖论的收益是真实的,每个忠诚者通过暂时放弃他们喜欢的消费品来平均获得效用,因为如果他们成功地储蓄以希望购买多瓶,那麽效用会很大如果价格在12月暴跌,则首选葡萄酒。
  分析时尚消费者的案例,他们除了潮流之外,对国籍漠不关心,这更複杂。这样的消费者,如果拥有美国葡萄酒,可能会错误地推理:“我目前有1瓶美国葡萄酒。如果我交易德国葡萄酒,我的预期价值将是1.25美元的美国葡萄酒。因此,我会过得更好。如果我像美国效忠者那样採取暂时交易的策略,则平均水平。”但是,这类似于“两个信封问题””,而本案中西格尔悖论的收益是虚幻的。使用美国忠诚者策略的时尚消费者,只剩下50%的机会获得0.5瓶新流行的美国流行葡萄酒,还有50%的机会获得2瓶一种新近不受欢迎的非流行美国葡萄酒;对于时尚消费者来说,这与拥有一瓶流行美国葡萄酒的50%机会和拥有一瓶非流行美国葡萄酒的50%机会相比,并没有实质性的改进。因此,时尚消费者平均而言只是收支平衡。同样,时尚消费者也不会从採用德国忠诚者的策略中获得效用。
  应用
  虽然葡萄酒和苹果只是玩具的例子,但这个悖论在现实世界中适用于投资者应该选择持有的货币。FischerBlack从与苹果/橘子案例类似的分析中得出结论,在海外投资时,投资者不应寻求对冲所有货币风险。其他研究人员认为这种分析过于简单。在许多情况下,西格尔悖论确实应该促使理性投资者变得更愿意接受适度的货币风险。在许多其他情况下,他们不应该;例如,如果汇率不确定性是由于实施购买力平价导致的不同通货膨胀率,则适用“两个信封”分析,并且可能没有特别的理由接受货币风险。
  几何均值和互易函数
  K.Mallahi-Karai和P.Safari提出了一种解决Siegel悖论的不同方法,他们表明,避免在这种基于未来的货币交易中赚取无风险资金的唯一可能方法是解决(加权)未来汇率的几何平均值,或者更一般地说,加权几何平均值和所谓的互惠函数的乘积。几何平均值的权重取决于未来发生率的概率,而互易函数总是可以被视为单位函数。例如,在上述苹果/橙子的例子中,这意味着消费者应该用他们的产品换取√(2)(1/2)=1单位的其他产品以避免套利.这种方法将为双方的货币交易者提供他们可以安全达成一致的共同汇率。
  圣彼得堡悖论
  圣彼得堡悖论或圣彼得堡彩票[1]是一个涉及掷硬币游戏的悖论,其中理论彩票游戏的预期收益接近无穷大,但对参与者来说似乎只值很小的一部分。圣彼得堡悖论是这样一种情况,即仅考虑预期值的幼稚决策标准预测了可能没有实际人愿意採取的行动过程。已经提出了几个解决这个悖论的方法。
  这个问题是由NicolasBernoulli[2]发明的,他在1713年9月9日给PierreRaymonddeMontmort的一封信中陈述了这个问题。[3][4]然而,这个悖论的名字来源于Nicolas的堂兄DanielBernoulli的分析。曾是同名俄罗斯城市的居民,他于1738年在圣彼得堡帝国科学院的评论中发表了他对这个问题的看法。
  圣彼得堡游戏
  赌场为单个玩家提供机会游戏,其中每个阶段都投掷一枚公平的硬币。初始赌注从2美元开始,每次出现正面时翻倍。第一次出现反面时,游戏结束,玩家赢得底池中的任何东西。因此,如果第一次出现反面,玩家赢得2美元,如果第一次出现正面,第二次出现反面,则玩家赢得4美元,如果前两次出现正面,第三次出现反面,则玩家赢得8美元,依此类推。数学上,玩家获胜2ķ+1美元,在哪裡ķ是连续抛头的次数。为进入游戏支付赌场的合理价格是多少?
  要回答这个问题,需要考虑每个阶段的预期支出:概率1/2,玩家赢2美元;有概率1/4玩家赢得4美元;有概率1/8玩家赢得8美元,以此类推。假设只要掷硬币产生正面,游戏就可以继续进行,特别是赌场拥有无限资源,因此预期价值为
  E=12⋅2+14⋅4+18⋅8+116⋅16+⋯=1+1+1+1+⋯=∞.
  这个总和无限增长,所以预期的胜利是无限量的钱。
  悖论
  只考虑一个人的货币财富淨变化的预期值,因此如果有机会,一个人应该不惜一切代价玩游戏。然而,丹尼尔·伯努利(DanielBernoulli)在以一金币的初始赌注描述了游戏后说:“虽然标准计算表明[玩家的]期望值是无限大的,但必须……承认任何相当合理的人们会非常高兴地以二十金币的价格出售他的机会。”罗伯特·马丁引用伊恩·哈金的话说:“我们中很少有人愿意支付25美元来参加这样的游戏,”他说大多数评论员都会同意。悖论是人们似乎愿意为进入游戏而付出的代价与无限期望值之间的差异。圣彼得堡悖论是一个真实的悖论,但不是矛盾的,因为没有得出错误的陈述。这是对期望值最大化原则的反例。
  解决方案
  已经提出了几种解决悖论的方法。
  期望效用理论
  悖论的经典解决方案包括明确引入效用函数、预期效用假设和货币边际效用递减的假设。
  用丹尼尔·伯努利的话来说:
  确定一件物品的价值不能以价格为基础,而要以它产生的效用为基础……毫无疑问,一千金币的收益对穷人来说比对富人更重要,儘管两者兼而有之获得相同的金额。
  DanielBernoulli提出的一种常见实用新型是对数函数U(w)=ln(w)(称为logutility)。它是赌徒总财富w的函数,其中包含货币边际效用递减的概念。预期效用假设假设存在一个效用函数,它为真实的人的行为提供了一个很好的标准;即一个函数,它返回一个正值或负值,指示赌注是好赌。对于每个可能的事件,效用ln(事件后的财富)-ln(事件前的财富)的变化将由该事件发生的概率加权。让c是进入游戏所收取的费用。彩票的预期增量效用现在收敛到一个有限值:
  ΔB(ü)=∑ķ=1+∞12ķ[ln⁡(w+2k−c)−ln⁡(w)]<+∞.
  这个公式给出了赌徒的财富和他应该愿意支付多少之间的隐含关係(具体来说,任何给预期效用带来正变化的c)。例如,对于自然对数效用,百万富翁(1,000,000美元)应该愿意支付高达20.88美元,拥有1,000美元的人应该支付高达10.95美元,拥有2美元的人应该借1.35美元并支付高达3.35美元。
  在丹尼尔·伯努利(DanielBernoulli)发表之前,1728年,来自日内瓦的数学家加布里埃尔·克莱默(GabrielCramer)已经发现了这个想法的一部分(也受到圣彼得堡悖论的启发),他指出
  数学家根据数量来估计货币,而有智慧的人则根据他们对货币的使用情况来估计。
  他在给NicolasBernoulli的一封信中证明,描述收益递减边际收益的平方根函数可以解决这个问题。然而,与丹尼尔伯努利不同的是,他不考虑一个人的总财富,而只考虑彩票的收益。
  然而,Cramer和Bernoulli的这个解决方案并不完全令人满意,因为彩票很容易以某种方式改变,从而使悖论再次出现。为了这个目标,我们只需要改变游戏,让它更快地增加收益。对于任何无界效用函数,人们都可以找到一种允许圣彼得堡悖论变体的彩票,正如门格尔首先指出的那样。
  最近,预期效用理论已经扩展到更多的行为决策模型。在其中一些新理论中,如在累积前景理论中,圣彼得堡悖论在某些情况下再次出现,即使效用函数是凹的,但如果它有界则不会。[10]
  概率加权
  尼古拉斯·伯努利本人提出了解决悖论的另一种想法。他推测人们会忽略不太可能发生的事件。因为在圣彼得堡彩票中,只有不太可能发生的事件才会产生导致无限期望值的高额奖金,这可以解决悖论。概率加权的想法在DanielKahneman和AmosTversky的前景理论工作中再次出现。PaulWeirich类似地写道,风险规避可以解决这个悖论。Weirich继续写道,增加奖金实际上会降低有人付费玩游戏的机会,并指出“手中有一些鸟比丛林中任何数量的鸟都更有价值”。然而,这已被一些理论家拒绝,因为正如他们所指出的,有些人喜欢赌博的风险,而且假设增加奖金会导致更多风险是不合逻辑的。
  累积前景理论是预期效用理论的一种流行概括,可以预测许多行为规律。然而,累积前景理论中引入的小概率事件的超重可能会恢復圣彼得堡悖论。只有在效用函数的功效係数低于概率加权函数的功效係数时,累积前景理论才能避免圣彼得堡悖论。直观地说,效用函数不能简单地是凹的,它必须相对于概率加权函数是凹的,以避免圣彼得堡悖论。有人可以争辩说,前景理论的公式是在不到400美元的区域内获得的。这不适用于圣彼得堡悖论中无限增加的金额。
  有限的圣彼得堡彩票
  经典的圣彼得堡游戏假设赌场或银行家拥有无限资源。这一假设长期以来一直受到质疑,认为不切实际。AlexisFontainedesBertins在1754年指出,任何潜在的游戏支持者的资源都是有限的。更重要的是,游戏的预期价值只随着赌场的资源呈对数增长。因此,游戏的预期价值,即使是在与实际可以想像到的最大资金的赌场对战时,也是相当低的。1777年,布冯伯爵Georges-LouisLeclerc计算出,经过29轮比赛后,法兰西王国将没有足够的钱来支付赌注。
  如果赌场的资源有限,那麽一旦这些资源耗尽,游戏就必须结束。假设赌场的总资源(或最大头奖)为W美元(更一般地说,W以游戏初始赌注的一半为单位来衡量)。那麽赌场在不能完全复盖下一个赌注之前可以玩的最大次数是L=floor(log2(W))。假设游戏结束时赌场无法再支付赌注,则彩票的期望值E变为:
  B=∑ķ=1L12ķ⋅2ķ=L.
  下表显示了与各种潜在银行家的博弈的期望值E和他们的资金W:
  银行家资金
  一场比赛的期望值
  百万富翁1,050,000美元20美元
  亿万富翁1,075,000,000美元30美元
  埃隆马斯克(2022年4月)[18]265,000,000,000美元38美元
  美国国内生产总值(2020)[19]20.8万亿美元44美元
  世界国内生产总值(2020)[19]83.8万亿美元46美元
  亿万富翁[20]10美元1859美元
  高富翁10100美元332美元
  注意:根据游戏规则,如果玩家赢的钱多于赌场的资金,他们将获得赌场所有的钱,额外的预期价值低于赌场有足够的资金来支付更多回合的金额,即更少超过1美元。玩家要赢得W,他必须被允许玩L+1轮。所以额外的期望值为W/2L+1。
  无限资源的前提在经济学中产生了各种明显的悖论。在马丁格尔投注系统中,赌徒在每次输掉硬币后下注,赌注翻倍,这样最终的胜利就可以弥补所有的损失;该系统因任何有限的资金而失败。赌徒的破产概念表明,一个顽固的赌徒在获胜时将赌注增加到其资金的固定比例,但在输球时不减少赌注,最终将不可避免地破产——即使游戏具有正期望值.
  拒绝数学期望
  包括JeanleRondd'Alembert和JohnMaynardKeynes在内的许多作者都拒绝将期望最大化(甚至效用最大化)作为适当的行为准则。凯恩斯尤其坚持认为,替代方案的相对风险可能足够高以拒绝它,即使它的期望是巨大的。最近,一些研究人员建议用中位数代替期望值作为公允价值。
  遍历性
  这个悖论可以通过遍历经济学来解决,它也拒绝使用数学期望,除非它可以通过动态论证来证明。遍历性是确保波动量的期望值也是其长期平均值的属性。这个性质被认为在平衡统计力学中成立,但它通常不适用于个人财富模型。为了使用遍历性概念来解决圣彼得堡悖论,人们计算在给定价格和财富下玩彩票所产生的财富的时间平均增长率。这与期望值所经历的增长不同对于任何不相加的动态。对于现实动态,时间平均增长率为零的彩票价格是玩家可能愿意支付的最高金额的现实价值。1870年,威廉·艾伦·惠特沃斯(WilliamAllenWhitworth)提出了一个包含假设乘法动力学的基本数学论证的早期解决方案。Peters在2011年提出了与遍历性问题的明确联繫。这些解决方案在数学上类似于使用凯利准则或对数效用。然而,从概念上讲,它们是不同的,因为它们强调将期望值解释为整体平均值并将玩家财富随时间的增长确定为更相关的标准。正如Carr和Cherubini在2020年指出的那样,超出纯乘法情况的一般动力学可以对应于非对数效用函数。
  酒/水悖论
  酒/水悖论是概率论中的一个明显悖论。MichaelDeakin是这样描述的:
  已知混合物中含有酒和水的比例,使得酒的量除以水的量是一个比率X位于区间1/3≤X≤3(即25-75%的葡萄酒)。我们寻求概率,P*比如说X≤2.(即小于或等于66%。)
  悖论的核心是找到一致且合理的同时先验分佈X和1X.
  计算
  我们不知道X,酒水比。我们只知道它位于一端的四分之三水(即25%的酒)与四分之三的水(即75%的酒)之间的间隔。.
  现在,利用无差异原则,我们可以假设X是均匀分佈的。然后找到比率的机会X低于任何给定的固定阈值Xt,和X米一世n<Xt<XmAX,应该线性依赖于值Xt.所以概率值就是个数
  概率{X≤Xt}=Xt-Xminxmax−xmin=18(3xt−1).
  作为阈值的函数Xt,这是线性增长的函数0分别1在终点XMin=1/43/4=13分别XMAX=3/41/4=3.
  考虑阈值Xt=2,如上面原始公式的示例。这是两份酒与一份水,即66%的酒。有了这个,我们得出结论
  概率{X≤2}=18(3⋅2-1)=58.
  现在考虑是的=1X,水与酒的倒数比,但等效的酒/水混合物阈值。它位于倒置界限之间。再次使用无差异原理,我们得到
  概率{Y≥Yt}=XMax(1−xminyt)xmax−xmin=38(3−yt).
  这是功能0分别1在终点3分别13.
  现在取相应的阈值Yt=1Xt=12(水量也是葡萄酒的一半)。我们得出结论
  概率{Y≥12}=383⋅2-12=1516=3258.
  第二个概率总是超过第一个概率XMaXXT≥1.对于我们的示例,数字是32.
  矛盾的结论
  自从Y=1X,我们得到
  58=概率⁡{x≤2}=P∗=Prob⁡{y≥12}=1516>58,
  一个矛盾。
热门推荐