章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。
Borel-Kolmogorov悖论
在概率论中,Borel-Kolmogorov悖论(有时称为Borel悖论)是与概率为零的事件(也称为零集)的条件概率相关的悖论。它以ÉmileBorel和AndreyKolmogorov的名字命名。
一个伟大的圆圈谜题
假设随机变量在单位球面上均匀分佈。它在大圆上的条件分佈是什麽?由于球体的对称性,人们可能会期望分佈是均匀的并且与坐标的选择无关。然而,两种分析给出了相互矛盾的结果。首先,注意在球面上均匀选择一个点,就相当于选择了经度λ均匀地从[-π,π]并选择纬度φ从[-π2,π2]有密度12因φ.然后我们可以看两个不同的大圆:
如果选择坐标使得大圆是赤道(纬度φ=0),经度的条件密度λ在区间上定义[-π,π]是
F(λ∣φ=0)=12π.
如果大圆是一条经线λ=0,条件密度为φ在区间[-π2,π2]是
F(φ∣λ=0)=12Uφ.
一种分佈在圆上是均匀的,另一种则不是。然而,两者似乎都指的是不同坐标系中的同一个大圆。
许多相当无用的争论——在其他有能力的概率论者之间——关于这些结果中的哪一个是“正确的”展开了激烈的争论。
—ET杰恩斯
解释和影响
在上述情况(1)中,假设φ=0,经度λ位于集合E中的条件概率可以写成P(λ∈E|φ=0)。初等概率理论表明这可以计算为P(λ∈E和φ=0)/P(φ=0),但由于P(φ=0)=0,该表达式没有明确定义。测度理论提供了一种方法定义条件概率,使用事件族Rab={φ:a<φ<b}是水平环,由纬度在a和b之间的所有点组成。
悖论的解决方法是注意到在情况(2)中,P(φ∈F|λ=0)是使用事件Lab={λ:a<λ<b}定义的,它们是半月形(垂直楔形),由经度在a和b之间变化的所有点组成。所以虽然P(λ∈E|φ=0)和P(φ∈F|λ=0)每个都提供一个大圆上的概率分佈,其中一个使用环定义,另一个使用月形定义。因此,毕竟P(λ∈E|φ=0)和P(φ∈F|λ=0)具有不同的分佈也就不足为奇了。
关于概率等于0的孤立假设的条件概率概念是不可接受的。因为只有把子午圆看作是整个球面分解成具有给定极点的子午圆的一个元素,我们才能得到子午圆上[纬度]的概率分佈
—安德烈·科尔莫哥洛夫
......在我们指定产生它的限制操作之前,术语“大循环”是模棱两可的。直观的对称论证以赤道极限为前提;然而,一个吃橙子片的人可能会以另一个人为前提。
—ET杰恩斯
数学解释
测量理论视角
为了理解这个问题,我们需要认识到一个连续随机变量的分佈是由密度f描述的,仅关于某个度量μ。两者对于概率分佈的完整描述都很重要。或者,等效地,我们需要完全定义要定义f的空间。
设Φ和Λ表示两个随机变量,取值Ω1=[-π2,π2]分别Ω2=[−π,π]。一个事件{Φ=φ,Λ=λ}给出了球体S(r)上的一个点,半径为r。我们定义坐标变换
X=rUφUλY=rUφGλz=rGφ
我们获得了体积元素
ωr(φ,λ)=‖∂(X,Y,z)∂φ×∂(x,y,z)∂λ‖=r2cosφ.{
此外,如果φ或λ是固定的,我们得到体积元素
ωr(λ)=‖∂(X,y,z)∂φ‖=r,respectivelyωr(φ)=‖∂(x,y,z)∂λ‖=rcosφ.
让
μΦ,Λ(dφ,dλ)=FΦ,Λ(φ,λ)ωr(φ,λ)dφdλ
表示联合测量B(Ω1×Ω2),有一个密度FΦ,Λ关于ωr(φ,λ)dφdλ然后让
μΦ(dφ)=∫λ∈Ω2μΦ,Λ(dφ,dλ),μΛ(dλ)=∫φ∈Ω1μΦ,Λ(dφ,dλ).
如果我们假设密度FΦ,Λ是均匀的,那麽
μΦ∣Λ(dφ∣λ)=μΦ,Λ(dφ,dλ)μΛ(dλ)=12rωr(φ)dφ,andμΛ∣Φ(dλ∣φ)=μΦ,Λ(dφ,dλ)μΦ(dφ)=12rπωr(λ)dλ.
因此,μΦ∣Λ有一个均匀的密度相对于ωr(φ)dφ但与Lebesgue测度无关。另一方面,μΛ∣Φ有一个均匀的密度相对于ωr(λ)dλ和勒贝格测度。
矛盾的证明
考虑一个随机向量(X,Y,Z)均匀分佈在单位球面上S2.
我们首先使用通常的球极坐标对球体进行参数化:
X=U(φ)U(θ)Y=U(φ)G(θ)z=G(φ)
在哪裡-π2≤φ≤π2和-π≤θ≤π.
我们可以定义随机变量Φ,θ作为的值(X,Y,Z)在此参数化的倒数下,或更正式地使用arctan2函数:
Φ=反正弦(Z)θ=反正切2(是1-Z2,X1-Z2)
使用表面积球冠和球楔的公式,球冠楔的表面由下式给出
aligned(θ≤θ,Φ≤φ)=(1+G(φ))(θ+π)
自从(X,是,Z)是均匀分佈的,概率与表面积成正比,给出联合累积分佈函数
FΦ,θ(φ,θ)=P(Θ≤θ,Φ≤φ)=14π(1+sin(φ))(θ+π)
联合概率密度函数由下式给出
FΦ,θ(φ,θ)=∂2∂φ∂θFΦ,θ(φ,θ)=14π因(φ)
注意Φ和θ是独立的随机变量。
为简单起见,我们不会计算大圆上的完整条件分佈,只计算随机向量位于第一个八分圆的概率。也就是说,我们将尝试计算条件概率P(A|B)和
A={0<Θ<π4}={0<X<1,0<Y<X}B={Φ=0}={Z=0}
我们试图将条件概率评估为对事件的条件限制
Bε={|Φ|<ε}
作为Φ和θ是独立的,事件也是如此A和Bε,所以
P(A∣B)=?limε→0P(A∩Bε)P(Bε)=limε→0P(A)=P(0<θ<π4)=18.
现在我们用不同的球体参数化重複这个过程:
X=G(φ)Y=U(φ)G(θ)z=-U(φ)U(θ)
这相当于之前的参数化绕y轴旋转了90度。
定义新的随机变量
Φ′=arcsin(X)Θ′=arctan2(Y1−X2,-Z1-X2).
旋转是保持度量的,所以密度Φ'和θ'是一样的:
FΦ',θ'(φ,θ)=14πU(φ).
A和B的表达式为:
A={0<θ<π4}={0<X<1,0<Y<X}={0<Θ′<π,0<Φ′<π2,sin(Θ′)<tan(Φ′)}B={Φ=0}={Z=0}={Θ′=−π2}∪{Θ′=π2}.
再次尝试将条件概率评估为对事件的条件限制
Bε'={|θ'+π2|<ε}∪{|θ'-π2|<ε}.
在积分符号下使用L'Hôpital规则和微分:
P(A∣B)=?Lε→0P(A∩Bε′)P(Bε′)=limε→014ε2πP(π2−ε<Θ′<π2+ε,0<Φ′<π2,sin(Θ′)<tan(Φ′))=π2limε→0∂∂ε∫π/2−ϵπ/2+ϵ∫0π/21sin(θ)<tan(φ)fΦ′,Θ′(φ,θ)dφdθ=π∫0π/211<tan(φ)fΦ′,Θ′(φ,π2)dφ=π∫π/4π/214πcos(φ)dφ=14(1−12)≠18
这表明条件密度不能被视为以概率为零的事件为条件,如条件概率#条件为概率为零的事件中所解释的。