search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

相關? 因果? 別讓統計學直覺騙了你!(文末有彩蛋)

提示:文末有醫咖會一周年彩蛋!

將兩個事物關聯到一起是人類與生俱來的學習能力。

小孩子會發現常常先有雞鳴、再有日出,日復一日便會建立二者之間的關聯,甚至去想猜想二者之間是否有因果關係。同樣,我們聽到窗外的蟬鳴便知盛夏已至,看到皚皚白雪便知深冬到來,也同樣是建立了兩者之間的聯繫。我們都知道,並不是蟬鳴帶來了盛夏,也不是白雪送來了深冬;甚至,若小孩子問你「是不是雞不叫的話天就不會亮了?」,你可能還會笑著說「傻孩子,是因為天亮才有了雞叫,而不是雞叫帶來了天明」。

常見的流行病學研究中,發現的大多是相關關係,而非因果關係。例如之前我們推送過的《內科學年鑒》的「咖啡攝入」和「降低死亡率」的關係,就被很多新聞媒體有意或無意地解讀為了因果關係。

今天,我們就一起來看看最常見的錯誤因果關係。

Reverse Causality 因果倒置

案例詳解

世界衛生組織在《嬰幼兒餵養指南》中建議母乳餵養兩年或更長的時間。相關研究也表明,與非母乳餵養的嬰幼兒相比,母乳餵養的嬰幼兒患某些傳染病的風險更低,也有更低的死亡率。然而,在一些研究中,研究人員發現,接受母乳餵養時間更長(>12個月)的嬰幼兒營養不良的風險更高。

1997年,來自Johns Hopkins等大學的研究人員專門就此進行了分析,發現具有較低社會經濟學地位(socioeconomic status)的家庭通常住在食物資源非常有限的社區內(如距離市中心、超市較遠),因此新生兒會無法得到充足的其他食物而更傾向於接受更長時間的母乳餵養。

這就是一個非常典型的因果倒置的例子:是嬰幼兒較差的健康狀況導致了更長時間的母乳餵養,而非更長時間的母乳餵養導致了更差的健康狀況。

(2005年,有研究聲稱「結婚的人」比「非婚的人」更加快樂。兩個人正在討論究竟是結婚導致了快樂,還是快樂的人更傾向於結婚。這就是在討論一個逆向因果的可能性。)

小咖解讀

逆向因果在醫學領域也很常見。例如,在一個橫斷面調查中,研究人員可能會發現「相對於不鍛煉的人,每周鍛煉次數多的人肥胖風險更高」,並得出錯誤的結論:「鍛煉次數多」導致「肥胖」。然而顯而易見的是,很大可能性是肥胖的人為了減肥,每周鍛煉次數更多。換句話說,是肥胖導致了鍛煉次數增加,而非鍛煉次數增加導致肥胖。

另一種常見的情況和疾病家族史有關。有糖尿病家族史的人可能會為了預防糖尿病而攝入更少的糖和脂肪,然而他們仍有更高的風險得糖尿病。在一個隊列研究中,研究人員如果沒有考慮「家族史」這樣的危險因素,這就可能得出錯誤的結論:「低糖低脂肪飲食」導致「糖尿病」。

因此,在做因果判斷時,我們始終不應該忘記考慮因果倒置的可能性。在收集數據時,也應該收集家族史、某種危險因素的暴露史(如吸煙史)等多種信息,並進行綜合考慮。

Common factor 共同因素

案例詳解

在研究中,研究人員發現腎衰竭和止痛藥的使用顯著相關,推測止痛藥的使用可能會導致腎衰竭。然而,實際的情況是:糖尿病是導致腎衰竭的主要危險因素之一,而糖尿病患者也更容易得其他疾病,如心血管疾病、某些傳染病,導致止痛藥的使用量增加。在這個例子中,「糖尿病」就是一個「共同因素」,既導致了止痛藥的使用增加、也導致了腎衰竭的風險增加,造成了止痛藥和腎衰竭之間假因果關係。

再舉一個更容易理解的例子。

在一個研究中,研究人員發現相比在家吃飯的人,不在家吃飯的人心血管健康水平更高。然而,實際的情況是:經濟水平較高的人通常心血管健康水平較高,而這些人也可能更忙、而更傾向於不在家吃飯。在這個例子中,「更好的經濟水平」也是一個「共同因素」,既導致了更好的心血管健康水平、也和不在家吃飯相關,造成了「不在家吃飯」和「更好的心血管水平」的假因果關係。

小咖解讀

因果關係很容易被其他因素所干擾,在流行病學中,我們稱其為混雜因素(confounders)。最經典的一個例子就是「賣出的冰淇淋數量越多,溺水人數就越多,因此,為了防止人們溺水,我們應該禁止售賣冰淇淋」。在這個例子中,我們很容易明白,是「溫度升高」這個因素導致了賣出的冰淇淋數量增多、也導致了溺水人數增加。我們稱「溫度升高」這個因素為混雜因素。

在實際研究中,我們有多種方法控制相關的混雜因素。如我們常見的在研究階段的配對(matching)、RCT中的隨機分配(randomization),以及在分析階段進行的Mantel-Haenszel方法、回歸(regression analysis)等等。

其他因果關係的混淆

相關不等於因果還可能因為其他原因。

如存在雙向因果關係(兩種因素可以互相影響彼此的存在),類似於生物學中捕食者與獵物的關係。李清偉等(2016)發現「失眠」和「焦慮障礙及抑鬱障礙」存在著雙向因果的關係,Waldman等(2006, 2008)研究也發現「過多觀看電視」和「小兒自閉症」存在著雙向因果的關係,可以互相導致。

也可能是僅僅出於巧合。例如有人發現每年美國在科學技術、宇宙航天方面的花費和上吊、窒息自殺的人數的關聯繫數達到了99.79%。當然,因為兩件事在同一時間發生,或者擁有相似的增長模式,並不意味這二者必然有聯繫。這兩件事情大概率是沒有關聯的,也就更提不上因果關係了。

在流行病學研究中,找到相關關係只是「萬里長征的第一步」。我們當然希望能夠證實某一種暴露(exposure)和某一個結果(outcome)之間的因果關係。然而,這需要更多的後續流行病學研究、也需要更多的基礎醫學研究來從分子水平上證實。

(相關不等於因果。來源:果殼網,獲取日期:2017/8/8)

長久以來,研究人員們一直在創造各種新的模型,很多的因果推斷理論、方法被用於各種研究之中,如流行病學家Austin Bradford Hill於1965年提出的九大因果推斷準則、David Lewis在1973年提出的Counterfactual理論、以及現在較新DAGs理論等。

作為臨床大夫、科研人員,對於醫學相關的信息,我們或許比其他非醫學專業人員更權威、更令人信服,而這也就更加要求我們充分理解相關性的含義,不要過高或過低解讀相關的研究結果。而在自己的研究中、尤其是在關聯性的探索中,我們更應該時時刻刻提醒自己「另一種解釋」存在的可能性,避免犯下混淆因果和相關的錯誤。

參考文獻

1. https://theconversation.com/the-seven-deadly-sins-of-statistical-misinterpretation-and-how-to-avoid-them-74306

2. http://www.tylervigen.com/spurious-correlations

3. https://larspsyll.wordpress.com/2014/12/30/reverse-causal-reasoning-and-inference-to-the-best-explanation/

4. https://www.pritikin.com/what-is-reverse-causation

5. http://www.pewsocialtrends.org/2006/02/13/are-we-happy-yet/

6. http://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704-ep713_confounding-em/BS704-EP713_Confounding-EM4.html

醫咖會一周年彩蛋

各位小夥伴,今天是醫咖會成立一周年的日子~~很開心能和大家在醫咖會平台上相遇。希望未來的日子裡,我們能一直陪伴彼此,共同成長!

下面是我們兩個小夥伴一起錄製的小視頻,大家一起來猜猜答案吧~~

有臨床研究設計或統計學方面的難題?xys2016ykf),加入醫咖會統計討論群,和小夥伴們一起交流學習吧。點擊左下角「閱讀原文」,看看醫咖會既往推送了哪些統計方法的文章。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦