Zi 字媒體
2017-07-25T20:27:27+00:00
在前面幾講中,我們已向大家介紹過如何依據一項測量指標設計和評價診斷試驗。但在實際臨床工作中,我們往往是根據多項指標綜合判斷病情的。比如,在診斷高血壓時,我們會根據年齡、性別、併發症等多個因素同時評價受試者的患病情況。那麼在這種情況下,我們應如何判斷診斷結果的真實性呢?一、問題與數據某呼吸內科醫生擬通過性別、年齡、BMI、COPD病史和是否吸煙等因素預測受試者的肺癌患病情況。他招募了85名肺癌患者,259名非肺癌患者,並通過查閱病歷、問卷調查的方式收集了上述信息。變數的賦值和部分原始數據見表1和表2。如果該醫生依據這幾項因素預測受試者是否患肺癌,那麼應如何預測,準確性又如何呢?表1 肺癌危險因素分析研究的變數與賦值表2 部分原始數據從本質上講,該研究也是結局變數為二分類的診斷試驗。但是該診斷試驗的測量指標很多,應該如何預測每一位受試者是否患肺癌呢?我們可以通過二分類Logistic回歸模型,用性別、年齡、BMI、COPD病史和是否吸煙等因素,計算受試者患肺癌的預測概率。二、SPSS分析方法1. 數據錄入SPSS2. Logistic回歸分析(關於Logistic回歸每一步設置的意義,可參考「SPSS實例教程:二分類Logistic回歸」。)選擇Analyze→Regression→Binary Logistic (1)主對話框設置將因變數cancer送入Dependent框中,將納入模型的自變數sex, age, BMI和COPD變數Covariates中,選擇Forward: LR的自變數篩選方法(Method對話框)。 (2)Categorical設置本研究中,COPD是多分類變數,我們指定「無COPD病史」的研究對象為參照組,分別比較「輕/中度」和「重度」組相對於參照組患肺癌的風險。點擊Categorical→將左側Covariates中的COPD變數送入右側Categorical Covariates中。在Reference Category的右側選擇First(表示選擇變數COPD中,賦值最小的,即「0」作為參照。)→點擊Change→點擊Continue。 (3)Save設置點擊Save→選擇Probabilities→點擊Continue。三、Logistic回歸結果1. 納入Logistic回歸模型的變數最終模型納入了性別(sex)、COPD病史(COPD)和吸煙(smoke)三個變數。也就是說,這該Logistic回歸模型認為,這三個變數可以預測是否患肺癌,而年齡和BMI並沒有預測意義。 2. 個體患肺癌的概率根據上述Logistic回歸的結果,我們可以寫出每個受試者根據性別、COPD病史和是否吸煙三個因素,預測是否患肺癌的危險得分Logit(P):Logit(P)= -3.062 + 0.836*sex(男=1;女=0) + 0.454*COPD(輕度) + 1.281COPD(中/重度) + 1.237*smoke(無=0;曾吸/現吸=1)並可以按照以下公式計算得到每一個受試者患肺癌的預測概率:實際上,當點選了上述2.5的操作,運行該回歸分析后,SPSS會自動生成每一位受試者的預測概率(PRE_1),而不需要上述的手工計算。 至此,我們就可以根據受試者的真實患病情況和預測概率,評估根據性別、COPD病史和是否吸煙三個因素,預測個體是否患肺癌的準確性了。四、ROC曲線的繪製1. 選擇Analyze→ROC Curve2. 主對話框設置將已知的疾病情況cancer送入State Variable框中,預測概率Predicted probability送入Test Variable中,並在Value of State Variable框中填1→OK。五、結果解讀SPSS的ROC曲線結果會給出ROC曲線和曲線下面積。根據結果,我們可以知道該診斷試驗的ROC曲線下面積是0.718,判斷其準確性,並用於與其他診斷試驗的比較。至於評價診斷試驗的其它指標,需要我們根據預測概率(PRE_1)確定診斷截點(cut-off值)后再計算,有興趣的小夥伴可以自己嘗試計算哦。醫咖會微信:medieco-ykh關注醫咖會,一起學習統計學~我們建了一個微信群,有臨床研究設計或統計學方面的難題?快加),拉你進群和其他小夥伴們一起交流學習。誠邀各位夥伴加入我們創作內容,請和小咖聯繫,和大家分享你喜愛的臨床研究以及有用的研究方法學知識。
寫了
5860316篇文章,獲得
23313次喜歡