search
樣本均數間的多重比較,你想知道的都在這裡!

樣本均數間的多重比較,你想知道的都在這裡!

單因素方差分析文章中,我們對3組患者的ALT水平進行了比較,方差分析結果為F=68.810,P<0.001,說明了三種治療措施對患者ALT水平的影響差異具有統計學意義。(詳見SPSS詳細操作:單因素方差分析

但是我們只能認為3組的總體均數不等或不全相等,即至少有2個處理組的均數處於不同水平。要想進一步了解是哪2組的均數相等,或者哪2組的均數處於不同水平,這就需要做多個樣本均數間的多重比較(multiple comparisons),也叫多個樣本均數間的兩兩比較

樣本間的多重比較是醫學研究領域較為常見的應用問題,其方法的選擇在統計學界爭議頗深,目前還沒有一種在任何條件下都適用、效果好的方法。關於樣本均數之間的多重比較,可供我們選擇的統計方法更有10多種之多。根據研究設計和研究目的的不同,其方法大致可以分為2種類型:

(1)用於證實性研究,在研究設計階段根據研究目的或專業知識就設定了要比較的組別,比如多個處理組與同一對照組比較。即我們事先就有一定假設,只關心某幾個組間的均數是否有差異,這叫做事前比較

(2)用於探索性研究,在研究設計階段不明確哪些組間的比較是我們更關注的,各處理組兩兩間的對比關係都要回答。即在整體檢驗有統計學差異之後,我們想知道哪些組間的均數有差異,對每一對樣本均數都進行比較,這叫做事後比較

接下來,我們結合實例討論2種類型研究在方差分析條件滿足時可採用的多重比較方法,但對各方法的具體原理和計算公式不做深入探討,主要關心其使用條件和應用方向。話不多說,上例子!

一、證實性研究適用的方法

某研究在社區隨機抽取了24名糖尿病患者、葡萄糖耐量減低(IGT)患者和健康人進行載脂蛋白測定(數據見下表),試問3組人群的載脂蛋白水平是否有差異?糖尿病和IGT患者相比於健康人的載脂蛋白水平又是否有差異?

表1. 三組人群的載脂蛋白水平

本例為證實性研究。經檢驗,各組資料方差齊,方差分析結果為F=4.832,P=0.019<0.05,3組人群載脂蛋白水平的差異有統計學意義。由於已經設定了健康人為對照組,要比較糖尿病患者和IGT患者相比於健康人的載脂蛋白水平差異,故糖尿病患者組和IGT患者組間不必再作比較。

常用方法有LSD-t檢驗法和Dunnett-t檢驗法。這2種方法不管方差分析結果如何,即使P值稍稍大於檢驗水準,也可以進行所關心組別間的比較

(1)LSD-t檢驗法最小顯著差異法,檢驗統計量為T,檢驗原理與t檢驗相同,但比一般t檢驗的敏感性高,只要各組均值間存在一定程度的微小差異就有可能被檢驗出來。LSD法側重於減小II類錯誤,但有增大I類錯誤的可能

(2)Dunnett-t檢驗法:新復極差檢驗法,統計量計算公式同LSD-t檢驗,但Dunnett-t檢驗有專門的界值表。適用於n-1個實驗組與1個對照組間均數差別的多重比較

二、探索性研究適用的方法

某研究在社區隨機抽取了24名糖尿病患者、葡萄糖耐量減低(IGT)患者和健康人進行載脂蛋白測定(數據見表1),試問3組人群的載脂蛋白水平是否有差異?如果有差異,具體又是哪兩組人群間的載脂蛋白水平有差異?

本例為探索性研究。方差分析結果與證實性研究一致,3組人群載脂蛋白水平的差異有統計學意義。由於不明確哪些組間的比較是我們更為關注的,因此我們要進行各組間的兩兩比較,常用方法有SNK-q檢驗法、Tukey法和Scheffe法。

(1)SNK-q檢驗法:檢驗后將沒有顯著差異的組別放在一個子集,有顯著差異的組別分在不同子集,控制了犯I類錯誤的概率。

(2)Tukey法:檢驗原理與SNK法基本相同,但是該方法要求各處理組樣本量相同。

(3)Scheffé's法:檢驗原理為對多組均數的線性組合是否為0進行假設檢驗,可以同時檢驗所有可能的對比,不用再兩兩去比較,多用於處理組樣本量不同的資料。

三、證實性研究和探索性研究均適用的方法

常用方法有Bonferroni-t檢驗法和Sidak-t檢驗法。(1)Bonferroni-t檢驗法:兩兩比較中最常用的方法之一,檢驗統計量為T。將α』=α/m作為檢驗水準的調整值(m為共需比較的次數,本例m=C32=3,α』=0.05/3=0.017),兩兩比較得出的P值與α』進行比較,即P<0.017時才能拒絕零假設。Bonferroni法應用範圍廣,還可以用於樣本率的兩兩比較,但在控制了I類錯誤的同時增大了II類錯誤發生的概率,在推斷結論方面比較保守,需要比較的次數越多(≥10次),結果越保守;當組間比較的次數不多時,Bonferroni法的效果較好(2)Šidák-t檢驗法:將α』=1-(1-α)1/m作為檢驗水準的調整值。Sidak-t檢驗原理與Bonferroni-t檢驗類似,是Bonferroni-t檢驗的精確計算,常在比較次數較多時使用(≥10次)。

推薦的方差分析流程,見圖1。

本例採用SPSS進行樣本均數間多重比較的結果如下圖所示,可以看出:糖尿病患者、IGT患者與健康人相比,載脂蛋白水平的差異有統計學意義(P<0.05),糖尿病患者與IGT患者載脂蛋白水平的差異無統計學意義(P>0.05)。但是,不同方法給出的P值不盡相同,有的甚至在0.05上下變化。因此,只有結合我們的研究目的和數據特點選擇合適的多重比較方法,才能得到科學合理的統計結果。

後續我們會帶來SPSS樣本均數間多重比較的操作教程多個樣本率間多重比較的知識講解,敬請期待!

參考文獻:

[1] 多個樣本均數間的兩兩比較. 循證醫學, 2008.

[2] 兩兩比較的Bonferroni法. 循證醫學, 2006.

(如果你想使用文中數據進行練習,請隨時給小咖()發消息,小咖將原始數據發給你。)

統計學教程精彩回顧:

醫咖會微信

:medieco-ykh

關注醫咖會,一起學習統計學~

我們建了一個微信群,有臨床研究設計或統計學方面的難題?快加,拉你進群和其他小夥伴們一起交流學習。誠邀各位夥伴加入我們創作內容,請和小咖聯繫,和大家分享你喜愛的臨床研究以及有用的研究方法學知識。

熱門推薦

本文由 一點資訊 提供 原文連結

一點資訊
寫了5860317篇文章,獲得23254次喜歡
留言回覆
回覆
精彩推薦