search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

了解ROC曲線下面積,有這篇文章就夠了

上一篇文章我們講了「如何繪製ROC曲線」,今天我們來詳解一下ROC曲線下面積。ROC曲線下面積(the area under the ROC curve, AUC)是指ROC曲線與x軸、(1,0)-(1,1)圍繞的面積,如圖1陰影部分。

一般來說,ROC曲線下面積在0到1之間。如果一項診斷試驗的靈敏度是1,而假陽性率是0,那麼該診斷試驗的ROC曲線下面積就是1。但是這樣的診斷試驗幾乎不存在,一個診斷試驗往往不能將所有的患者和非患者都準確地識別出來。同時,也不會出現某一項診斷試驗的ROC曲線下面積為0的情況,因為基本不會有一項診斷試驗錯誤地識別了所有的患者和非患者。即使真的有這樣的診斷試驗,我們只需要將所有的診斷結果反過來,就可以得到完美結果。

也因為如此,我們認為ROC曲線下面積不會低於0.5,如果低了,我們只需將診斷翻轉,就能得到更好的結果。如果診斷試驗的結果完全隨機(等同於診斷時,靠投擲硬幣,正面向上認為是患者,反面向上認為是非患者),那麼我們得到的ROC曲線下面積就是0.5,即ROC曲線下面積的最小值是0.5。

可見,只要ROC曲線下面積大於0.5,就證明該診斷試驗具有一定的診斷價值。同時,ROC曲線下面積越接近1,離(0,1)點越近,證明診斷試驗的真實性越好。

第一個栗子

仍以甲狀旁腺診斷試驗為例,現有SPECT、AC SPECT(衰減矯正SPECT)和SPECT/CT三種方法對同一患者群進行診斷。根據診斷試驗結果,研究者將患者甲狀旁腺的病變情況分為1-5五個等級。1級為完全沒有甲狀旁腺病變,2級為可能沒有甲狀旁腺病變,3級為可能存在甲狀旁腺病變,4級為疑似甲狀旁腺病變,5級為確診甲狀旁腺病變。得到診斷結果后,我們以3-5級為診斷陽性,1、2級為診斷陰性,並根據手術結果統一評價這三項診斷試驗的準確性,如表1。

從表1可以看出,在設置相同截點的情況下,不同診斷試驗的真實性不同。其中,SPECT/CT的ROC曲線下面積最接近1,相比於SPECT和AC SPECT具有更好的診斷準確性。

那麼,SPECT/CT的ROC曲線下面積(0.83)有什麼實際含義嗎?

如果我們使用SPECT/CT隨機檢查2位受試者,其中一位患有甲狀旁腺病變,而另一位沒有,那麼SPECT/CT診斷試驗正確區分患者和非患者的可能性為0.83。

同時,如果我們只看ROC曲線,也可以比較不同診斷試驗的真實性,如圖2。其中,SPECT/CT診斷試驗的ROC曲線更接近於(0,1)點,所以它比AC-SPECT診斷試驗具有更好的準確性。

圖2中兩個做標記的點是以3級(可能存在甲狀旁腺病變)診斷結果為截點進行坐標的,與表1中的情況一致。這是因為擬合后ROC曲線會略有變化,這兩個點均與原坐標點的位置會略有差異。

僅僅從表1中的數據來看,我們可能認為AC SPECT診斷試驗的靈敏度(0.80)高於SPECT/CT診斷試驗的靈敏度(0.70)。但是從圖2我們可以看出,無論是在哪一個假陽性率的位置上,SPECT/CT診斷試驗的靈敏度都比AC SPECT診斷試驗的靈敏度好。可見,在實際臨床工作中,僅以某一個截點的數據評價不同試驗的靈敏度是不準確的,我們應根據ROC曲線下面積進行綜合判斷。

那麼,我們一定會選擇ROC曲線下面積比較大的診斷試驗嗎?

答案也是否定的。

通過上一講對ROC曲線繪製方法的介紹,大家應該知道ROC曲線與受試人群的患病率以及漏診、誤診的危害程度無關,僅僅是綜合評價一項診斷試驗的靈敏度和特異度兩個指標。

現假設我們想通過診斷試驗判斷無癥狀人群的心血管病變情況。在臨床實際工作中,這些無癥狀的就診人群真實患心血管病變的可能性相對較小。為了減少誤診帶來的醫療資源浪費和恐慌,我們可能會更傾向於選擇特異度較高的診斷試驗和截點。在這種情況下,靈敏度指標對診斷試驗的整體準確性的影響較小。我們僅會根據ROC曲線中的一部分(特異度較高的區域),而不是全部的ROC曲線下面積來選擇診斷試驗。

可見,完全依靠ROC曲線下面積評價診斷試驗的準確性是容易產生誤導的。即使是ROC曲線下面積相同的兩個診斷試驗也可能存在不同的臨床適用範圍。

再來一個栗子

下圖3中,我們向大家展示了兩條相交的ROC曲線。相比之下,曲線A下的面積(0.85)比曲線B下的面積(0.80)大。僅根據ROC曲線下面積,我們應該以A診斷試驗為首選。但是,如果在臨床應用中,我們需要一個特異度比較好的診斷試驗,B診斷試驗應該成為我們的首選。因為在特異度高、假陽性率低的區域,診斷試驗B的ROC曲線優於診斷試驗A。

由此可見,雖然ROC曲線和曲線下面積可以準確地反映診斷試驗的真實性,但是在實際工作中,我們必須根據受試人群的特徵、診斷結果的臨床影響、診斷的經濟成本等因素綜合選擇適合的診斷試驗。換言之,只有在適合的受試人群和受試條件下,診斷試驗的真實性才能得到保障。

醫咖會微信

:medieco-ykh

關注醫咖會,你會發現研究方法學沒那麼可怕

我們建了一個微信群,有臨床研究設計或統計學方面的難題?快加,拉你進群和其他小夥伴們一起交流學習。誠邀各位夥伴加入我們創作內容,請和小咖聯繫,和大家分享你喜愛的臨床研究以及有用的研究方法學知識。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦