章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。
低出生體重悖論
低出生體重悖論是一個與吸煙母親所生孩子的出生體重和死亡率有關的明顯自相矛盾的觀察。吸煙母親所生的低出生體重兒的嬰兒死亡率低於非吸煙者所生的低出生體重兒。這是辛普森悖論的一個例子。
歷史
傳統上,體重低於一定體重(不同國家/地區不同)的嬰兒被歸類為低出生體重。在特定人群中,低出生體重嬰兒的死亡率明顯高於其他嬰兒;因此,低出生體重率較高的人群的兒童死亡率通常也高於其他人群。
根據先前的研究,吸煙母親的孩子比不吸煙母親的孩子更容易出生體重過低。因此,從廣義上講,吸煙母親的孩子的兒童死亡率應該更高。因此,令人驚訝的現實觀察是,吸煙母親的低出生體重嬰兒的兒童死亡率低於非吸煙母親的低出生體重嬰兒。
解釋
乍一看,這些發現似乎表明,至少對一些嬰兒來說,有一個吸煙的母親可能對一個人的健康有益。然而,這個悖論可以通過揭示吸煙與兩個關鍵變量之間的潛伏變量來解釋統計:出生體重和死亡風險。這兩個變量都受到吸煙和其他不利條件的獨立影響——出生體重降低,死亡風險增加。但是,每個條件不一定會在相同程度上影響兩個變量。
吸煙母親的孩子的出生體重分佈因母親的行為而轉移到較低的體重。因此,原本健康的嬰兒(如果不是因為他們的母親吸煙,他們的體重會更重)出生時體重不足。然而,與其他更嚴重的醫學原因導致他們出生時體重不足的兒童相比,他們的死亡率仍然較低。
簡而言之,吸煙是有害的,因為它導致低出生體重的死亡率高於正常出生體重,但其他導致低出生體重的原因通常比吸煙更有害。
證據
如果通過分層或多變量回歸模型對吸煙的混雜因素進行校正和調整,以對吸煙進行統計控制,則會發現出生體重與死亡率之間的關聯可能會減弱至零。儘管如此,大多數關於出生體重和死亡率的流行病學研究都控制了母親吸煙,調整後的結果雖然在調整吸煙後有所減弱,但仍表明存在顯著關聯。
對出生體重和死亡率可以獨立作用的假設的額外支持來自對科羅拉多州出生數據的分析:與整個美國的出生體重分佈相比,科羅拉多州的分佈曲線也向較低的體重轉移。然而,科羅拉多州兒童的總體兒童死亡率與美國兒童相同,如果校正上述較低的體重,則會發現具有給定(校正)體重的嬰兒同樣可能死亡,無論他們來自科羅拉多與否。這裡可能的解釋是,科羅拉多州的海拔較高會影響出生體重,但不會影響死亡率。
辛普森悖論
辛普森悖論是概率和統計中的一種現象,其中趨勢出現在幾組數據中,但當這些組組合時消失或反轉。這個結果在社會科學和醫學科學統計中經常遇到,當頻率數據被不恰當地給出因果解釋時尤其成問題。當在統計建模中適當地處理混雜變量和因果關係時,可以解決這個悖論。辛普森悖論被用來說明那種誤導性的結果,即濫用統計數據可能會產生。
EdwardH.Simpson在1951年的一篇技術論文中首次描述了這種現象,但統計學家KarlPearson(1899年)和UdnyYule(1903年)早先提到了類似的影響。辛普森悖論這個名字是由ColinR.Blyth在1972年提出的。它也被稱為辛普森逆轉、尤爾-辛普森效應、合併悖論或逆轉悖論。
數學家喬丹·艾倫伯格認為,辛普森悖論被錯誤地命名為“不涉及約束,只是考慮相同數據的兩種不同方式”,並暗示其教訓“並不是真正告訴我們採取哪種觀點,而是堅持我們堅持同時考慮部分和整體”。
例子
加州大學伯克利分校性別偏見
辛普森悖論最著名的例子之一來自對加州大學伯克利分校研究生招生中的性別偏見的研究。1973年秋季的錄取數據顯示,申請的男性比女性更容易被錄取,而且差異如此之大,不可能是偶然的。
全部男士女性
申請人錄取申請人錄取申請人錄取
全部的12,76341%8,44244%4,32135%
然而,考慮到申請部門的信息,不同的拒絕率揭示了進入部門的不同難度,同時也表明女性傾向於申請更具競爭力、錄取率較低的部門,即使在合格的申請者中(例如英語系),男性也傾向於申請競爭較少但錄取率較高的系(例如工程系)。匯總和校正的數據顯示“有利於女性的小但統計上顯著的偏差”。
六大部門的數據如下:
部門全部男士女性
申請人錄取申請人錄取申請人錄取
一個93364%82562%10882%
乙58563%56063%2568%
C91835%32537%59334%
D79234%41733%37535%
乙58425%19128%39324%
F7146%3736%3417%
全部的2639%2691%1835年30%
傳奇:
成功申請者的比例高於其他性別
申請人數多於其他性別
粗體-每個性別的兩個“申請最多”的部門
整個數據顯示,在85個部門中,共有4個部門對女性有顯著偏見,而6個部門對男性有顯著偏見(並非所有部門都出現在上面的“六大部門”表中)。值得注意的是,有偏見的部門的數量並不是得出結論的基礎,而是所有部門的性別錄取匯總,同時衡量了每個部門在所有申請人中的拒絕率。數據是否顯示明確的偏向女性的偏見或僅偏向少數群體的偏見(或兩者的組合)可能是分析的不同方面:數據可能顯示偏向少數群體性別的偏見,這在發生與“更成功的申請人”(綠色)相比,性別完全相反的“更多申請人”(橙色),並且女性是整個申請人群體中的少數(見總數),因此更有可能在更多的部門中成為少數(如果總數中超過856人的男性累積在頂級男性中,情況就不會如此)部門,事實並非如此)。然而,這篇論文並沒有探討這個細節(儘管它確實認識到“推動招募少數群體成員”作為對某些女性數據現象的解釋)。
腎結石治療
另一個例子來自一項真實的醫學研究,比較了兩種治療腎結石的成功率。下表顯示了包括小腎結石和大腎結石的治療的成功率(這裡的術語成功率實際上是指成功比例)和治療次數,其中治療A包括開放式手術,治療B包括封閉式手術.括號中的數字表示成功案例的數量超過該組的總規模。
治療
石頭大小
治療A治療B
小石頭第1組
93%(81/87)第2組
87%(234/270)
大石頭第3組
73%(192/263)第4組
69%(55/80)
兩個都78%(273/350)83%(289/350)
矛盾的結論是,治療A在用於小結石和大結石時更有效,但在同時考慮兩種尺寸時,治療B似乎更有效。在這個例子中,導致悖論的“潛伏”變量(或混雜變量)是結石的大小,在將其影響納入之前,研究人員並不知道它的重要性。
哪種治療被認為更好取決於哪個成功率(成功/總數)更大。在考慮組合數據時,兩個比率之間的不等式發生逆轉,這會產生辛普森悖論,因為兩種效應同時發生:
當忽略潛伏變量時組合的組的大小非常不同。醫生傾向於對結石大的病例進行較好的治療A,而對結石較小的病例給予較差的治療B。因此,總數以第3組和第2組為主,而不是由較小的第1組和第4組控制。
潛伏的變量,石頭的大小,對比率有很大的影響;即,成功率受病例嚴重程度的影響比受治療選擇的影響更大。因此,使用治療A的大結石患者組(第3組)的效果比小結石組更差,即使後者使用了較差的治療B(第2組)。
基於這些影響,我們看到了自相矛盾的結果,因為結石大小的影響壓倒了更好治療的好處(A)。簡而言之,效果較差的治療B似乎更有效,因為它更頻繁地應用於更容易治療的小結石病例。
擊球率
辛普森悖論的一個常見例子是職業棒球運動員的擊球率。一個球員有可能在幾年內每年都有比另一名球員更高的擊球率,但在所有這些年裡都有一個較低的擊球率。當年份之間的蝙蝠數量存在很大差異時,就會發生這種現象。數學家肯·羅斯使用1995年和1996年期間兩名棒球運動員德里克·傑特和大衛·賈斯蒂斯的擊球率證明了這一點:
年
19951996結合
德里克·傑特12/48.250183/582.314195/630.310
大衛104/411.253/140.321149/551.270
在1995年和1996年,Justice的擊球率(粗體字)都比Jeter高。然而,當兩個棒球賽季結合起來時,傑特的擊球率高於正義。根據羅斯的說法,這種現象每年大約會在可能的成對球員中觀察到一次。
向量解釋
辛普森悖論也可以用二維向量空間來說明。成功率pq(即,成功/嘗試)可以用向量表示一個→=(q,p),斜率為pq.更陡峭的矢量則表示更大的成功率。如果兩個費率p1q1和p2q2組合起來,如上面給出的例子,結果可以用向量的總和來表示(q1,p1)和(q2,p2),根據平行四邊形規則是向量(q1+q2,p1+p2),有坡度p1+p2q1+q2.
辛普森悖論說,即使一個向量L→1(圖中橙色)的斜率小於另一個向量B→1(藍色),和L→2斜率小於B→2,兩個向量之和L→1+L→2可能仍然具有比兩個向量之和更大的斜率B→1+B→2,如示例所示。為此,橙色向量之一必須具有比藍色向量之一更大的斜率(這裡L→2和B→1),並且這些通常會比可選下標向量更長——從而在整體比較中占主導地位。
變量之間的相關性
辛普森的逆轉也可能出現在相關性中,其中兩個變量似乎(例如)彼此正相關,而實際上它們具有負相關,逆轉是由“潛伏”的混雜因素引起的。伯曼等人。舉了一個經濟學的例子,其中一個數據集表明總體需求與價格呈正相關(即更高的價格導致更多的需求),這與預期相矛盾。分析表明時間是一個混雜變量:將價格和需求與時間作圖揭示了不同時期的預期負相關性,如果通過簡單地繪製需求與價格的關係而忽略時間的影響,則反過來變為正相關。
心理學
對辛普森悖論的心理興趣試圖解釋為什麼人們一開始認為符號反轉是不可能的,因為當條件未知時應該拒絕在一個條件下首選的動作和在它的否定下都應該被拒絕的想法,這使人們感到冒犯。問題是人們從哪裡獲得這種強烈的直覺,以及它是如何在頭腦中編碼的。
辛普森的悖論表明,這種直覺不能僅來自經典邏輯或概率演算,因此導致哲學家推測它得到了一種先天的因果邏輯的支持,這種邏輯引導人們對行動及其後果進行推理。Savage的確定性原則是這種邏輯可能需要的一個例子。Savage的確定性原則的一個合格版本確實可以從Pearl的do-calculus中得出,並寫道:“在每個子群體Ci中增加事件B的概率的動作A如果動作不改變子種群的分佈,C的概率也必須增加整個種群中B的概率。”這表明有關動作和後果的知識以類似於因果貝葉斯網絡的形式存儲。
可能性
Pavlides和Perlman的一篇論文證明,由於Hadjicostas,在均勻分佈的隨機2×2×2表中,辛普森悖論的發生概率恰好為1⁄60。Kock的一項研究表明,在具有兩個預測變量和一個標準變量的路徑模型(即路徑分析生成的模型)中,辛普森悖論隨機發生的概率約為12.8%;略高於每8個路徑模型出現1次。
辛普森的第二個悖論
第二個鮮為人知的悖論也在辛普森1951年的論文中進行了討論。當“合理的解釋”不一定在分離的數據中找到時,就會發生這種情況,就像在腎結石的例子中一樣,而是可以存在於組合數據中。是否應該使用數據的分區或組合形式取決於產生數據的過程,這意味著不能總是通過簡單地觀察表格來確定對數據的正確解釋。
JudeaPearl表明,為了使分區數據能夠代表任何兩個變量之間的正確因果關係,X和Y,分區變量必須滿足稱為“後門準則”的圖形條件:
他們必須阻止之間的所有虛假路徑X和Y
任何變量都不會受到影響X
該標準為辛普森的第二個悖論提供了算法解決方案,並解釋了為什麼不能僅通過數據來確定正確的解釋;兩個與數據兼容的不同圖表可能規定了兩個不同的後門標準。
當一組協變量滿足後門標準時,調整公式(參見混雜)給出了X對Y的正確因果效應。如果不存在這樣的集合,則可以調用Pearl的do-calculus來發現估計因果效應的其他方法。[4][27]do-calculus[28][27]的完整性可以被視為提供了對辛普森悖論的完整解決方案。