Zi 字媒體

樣本均數間的多重比較，你想知道的都在這裡！

2021/12/25

單因素方差分析文章中，我們對3組患者的ALT水平進行了比較，方差分析結果為F=68.810，P<0.001，說明了三種治療措施對患者ALT水平的影響差異具有統計學意義。（詳見SPSS詳細操作：單因素方差分析）

但是我們只能認為3組的總體均數不等或不全相等，即至少有2個處理組的均數處於不同水平。要想進一步了解是哪2組的均數相等，或者哪2組的均數處於不同水平，這就需要做多個樣本均數間的多重比較（multiple comparisons），也叫多個樣本均數間的兩兩比較。

樣本間的多重比較是醫學研究領域較為常見的應用問題，其方法的選擇在統計學界爭議頗深，目前還沒有一種在任何條件下都適用、效果好的方法。關於樣本均數之間的多重比較，可供我們選擇的統計方法更有10多種之多。根據研究設計和研究目的的不同，其方法大致可以分為2種類型：

（1）用於證實性研究，在研究設計階段根據研究目的或專業知識就設定了要比較的組別，比如多個處理組與同一對照組比較。即我們事先就有一定假設，只關心某幾個組間的均數是否有差異，這叫做事前比較；

（2）用於探索性研究，在研究設計階段不明確哪些組間的比較是我們更關注的，各處理組兩兩間的對比關係都要回答。即在整體檢驗有統計學差異之後，我們想知道哪些組間的均數有差異，對每一對樣本均數都進行比較，這叫做事後比較。

接下來，我們結合實例討論2種類型研究在方差分析條件滿足時可採用的多重比較方法，但對各方法的具體原理和計算公式不做深入探討，主要關心其使用條件和應用方向。話不多說，上例子！

一、證實性研究適用的方法

某研究在社區隨機抽取了24名糖尿病患者、葡萄糖耐量減低（IGT）患者和健康人進行載脂蛋白測定（數據見下表），試問3組人群的載脂蛋白水平是否有差異？糖尿病和IGT患者相比於健康人的載脂蛋白水平又是否有差異？

表1. 三組人群的載脂蛋白水平

本例為證實性研究。經檢驗，各組資料方差齊，方差分析結果為F=4.832，P=0.019<0.05，3組人群載脂蛋白水平的差異有統計學意義。由於已經設定了健康人為對照組，要比較糖尿病患者和IGT患者相比於健康人的載脂蛋白水平差異，故糖尿病患者組和IGT患者組間不必再作比較。

常用方法有LSD-t檢驗法和Dunnett-t檢驗法。這2種方法不管方差分析結果如何，即使P值稍稍大於檢驗水準，也可以進行所關心組別間的比較。

（1）LSD-t檢驗法：最小顯著差異法，檢驗統計量為T，檢驗原理與t檢驗相同，但比一般t檢驗的敏感性高，只要各組均值間存在一定程度的微小差異就有可能被檢驗出來。LSD法側重於減小II類錯誤，但有增大I類錯誤的可能。

（2）Dunnett-t檢驗法：新復極差檢驗法，統計量計算公式同LSD-t檢驗，但Dunnett-t檢驗有專門的界值表。適用於n-1個實驗組與1個對照組間均數差別的多重比較。

二、探索性研究適用的方法

某研究在社區隨機抽取了24名糖尿病患者、葡萄糖耐量減低（IGT）患者和健康人進行載脂蛋白測定（數據見表1），試問3組人群的載脂蛋白水平是否有差異？如果有差異，具體又是哪兩組人群間的載脂蛋白水平有差異？

本例為探索性研究。方差分析結果與證實性研究一致，3組人群載脂蛋白水平的差異有統計學意義。由於不明確哪些組間的比較是我們更為關注的，因此我們要進行各組間的兩兩比較，常用方法有SNK-q檢驗法、Tukey法和Scheffe法。

（1）SNK-q檢驗法：檢驗后將沒有顯著差異的組別放在一個子集，有顯著差異的組別分在不同子集，控制了犯I類錯誤的概率。

（2）Tukey法：檢驗原理與SNK法基本相同，但是該方法要求各處理組樣本量相同。

（3）Scheffé's法：檢驗原理為對多組均數的線性組合是否為0進行假設檢驗，可以同時檢驗所有可能的對比，不用再兩兩去比較，多用於處理組樣本量不同的資料。

三、證實性研究和探索性研究均適用的方法

常用方法有Bonferroni-t檢驗法和Sidak-t檢驗法。（1）Bonferroni-t檢驗法：兩兩比較中最常用的方法之一，檢驗統計量為T。將α』=α/m作為檢驗水準的調整值（m為共需比較的次數，本例m=C32=3，α』=0.05/3=0.017），兩兩比較得出的P值與α』進行比較，即P<0.017時才能拒絕零假設。Bonferroni法應用範圍廣，還可以用於樣本率的兩兩比較，但在控制了I類錯誤的同時增大了II類錯誤發生的概率，在推斷結論方面比較保守，需要比較的次數越多（≥10次），結果越保守；當組間比較的次數不多時，Bonferroni法的效果較好。（2）Šidák-t檢驗法：將α』=1-(1-α)1/m作為檢驗水準的調整值。Sidak-t檢驗原理與Bonferroni-t檢驗類似，是Bonferroni-t檢驗的精確計算，常在比較次數較多時使用（≥10次）。

推薦的方差分析流程，見圖1。

本例採用SPSS進行樣本均數間多重比較的結果如下圖所示，可以看出：糖尿病患者、IGT患者與健康人相比，載脂蛋白水平的差異有統計學意義（P<0.05），糖尿病患者與IGT患者載脂蛋白水平的差異無統計學意義（P>0.05）。但是，不同方法給出的P值不盡相同，有的甚至在0.05上下變化。因此，只有結合我們的研究目的和數據特點選擇合適的多重比較方法，才能得到科學合理的統計結果。

後續我們會帶來SPSS樣本均數間多重比較的操作教程和多個樣本率間多重比較的知識講解，敬請期待！

參考文獻：

[1] 多個樣本均數間的兩兩比較. 循證醫學, 2008.

[2] 兩兩比較的Bonferroni法. 循證醫學, 2006.

（如果你想使用文中數據進行練習，請隨時給小咖（）發消息，小咖將原始數據發給你。）

統計學教程精彩回顧：

醫咖會微信

：medieco-ykh

關注醫咖會，一起學習統計學~

我們建了一個微信群，有臨床研究設計或統計學方面的難題？快加），拉你進群和其他小夥伴們一起交流學習。誠邀各位夥伴加入我們創作內容，請和小咖聯繫，和大家分享你喜愛的臨床研究以及有用的研究方法學知識。

桃園 qq 地點貓咪桃園市 taoyuan xuan 根部尾巴有大桃園旅遊景點