在Meta分析時,遇到有序暴露與多結局資料往往是一件令人煩惱的事,常規的“高VS低”方法,舍棄了中間組別的信息,降低了檢驗效能,本文介紹一種利用EXCEL宏程序實現Meta分析中有序暴露與多結局研究效應量合并的方法。全文先介紹合并思路和原理,再結合實例數據,利用EXCEL宏程序實現兩類不同情況數據合并的過程。結果顯示:兩類不同情況數據合并結果與原始數據再次分析結果相似。因此,在無法獲取原始研究數據的情況下,EXCEL宏程序能很好地解決有序暴露與多結局資料效應量合并的問題。
引用本文: 周權, 郭鵬, 張超, 徐暢. 應用EXCEL宏程序實現Meta分析中有序暴露與多結局資料研究效應量合并. 中國循證醫學雜志, 2016, 16(8): 978-983. doi: 10.7507/1672-2531.20160150 復制
在觀察性研究Meta分析中,經常會遇到有序暴露資料的情況,如在一項關于觀看電視和電腦屏幕時間與總死亡率關系的隊列研究中,觀看屏幕的時間分為“< 1 h/d”、“1~2 h/d”、“3~4 h/d”、“5~6 h/d”、“≥7 h/d”五個組別,原始研究只提供了相對于最低組別(“< 1 h/d”),其他各組調整相關混雜因素的效應量(如OR或RR)及其95%CI。而在Meta分析中,希望原始研究提供觀看屏幕時間≥5 h/d與最低組相比較的校正RR值及其95%CI。這時,如果簡單將“5~6 h/d”、“≥7 h/d”兩組用固定效應模型合并是不可取的,因為觀看屏幕時間的五個分類不是獨立的數據,而是一組有序的相關數據,不能進行簡單的合并[1]。與此類似,當評價被動吸煙與肺癌的關系時,原始研究給出的結局指標是不同的肺癌病理類型:“鱗癌”、“腺癌”、“小細胞癌”、“大細胞癌”、“其他癌”的多因素分析效應量及其95%CI,而Meta分析希望得到是僅僅是吸煙與所有肺癌的效應量與95%CI。如果簡單地將各種病理類型的效應量用固定效應模型進行合并也是不可取的。這兩種類型數據在劑量反應Meta分析[2-4]中隨處可見,尋找合適的轉換方法,將極大推動此類Meta分析的發表,本文將對轉換的原理與方法作一介紹,以期為解決此類問題提供指導。
1 思路與原理
1.1 處理思路
1.1.1 有序暴露資料效應量合并處理思路
流行病學研究中探討有序暴露水平與發生某類結局(疾病)關系的研究論文中常呈現這些信息:①多因素統計分析調整多種混雜后,以最低或最高水平暴露組作為參照,其他組別均與之對比的效應量(OR或RR)及其95%CI;②各級暴露水平發生與不發生某類結局的例數。為了將有序暴露資料不同組別進行再次組合分析(如前言中將五分類觀看屏幕時間數據轉換成≥5 h/d與最低組相比較的情況),Greenland和Longnecker [5]提出了一種解決方案:利用原始研究中提供的數據①與數據②通過數學規劃求解產生一組模擬校正混雜后的各級暴露水平發生與不發生某類結局的偽有效例數,再利用這些偽有效例數估計再次組合情況下的暴露情況與發生某類結局的效應量及95%CI。
1.1.2 多結局資料效應量合并處理思路
探討暴露因素與多結局資料原始研究提供的數據一般是:①多因素統計分析調整多種混雜后,以健康組或某類疾病組作為參照,其他組別均與之對比的效應量及其95%CI;②不同疾病結局組與是否暴露的例數。為了將不同結局組別進行再次組合分析(如前言中將“正常組”、“鱗癌”、“腺癌”、“小細胞癌”、“大細胞癌”、“其他癌”六分類結局資料轉換為“正常組”和“肺癌組”二分類情況)分析思路也是先利用原始研究中提供的數據①與數據②通過數學規劃求解產生一組模擬校正混雜后的不同結局組別與是否暴露的偽有效例數,再利用這些偽有效例數估計再次組合情況下的不同結局與危險因素暴露的效應量及95%CI。
1.2 基本原理
1.2.1 有序暴露資料效應量合并基本原理
此轉換主要是應用于流行病學研究中的病例-對照研究、隊列研究二種類型,本文以隊列研究為例對其基本原理作一介紹,病例-對照研究情況可依此類推。
隊列研究常以表 1的形式呈現研究數據,B0表示非暴露組人數或人年,Bi表示不同水平暴露組人數或人年,A0表示非暴露組發生研究結局的人數,Ai表示不同水平暴露組發生研究結局的人數。

通過公式(1)可以計算不同水平暴露組相對于參照組的效應量RR的自然對數:
$ LnR{R_i}=\ln \left({\frac{{{A_i}{B_0}}}{{{A_0}{B_i}}}} \right) $ |
通過公式(2)可以計算不同水平暴露組相對于參照組的效應量RR自然對數方差:
$ {V_i}=\frac{1}{{{A_0}}}-\frac{1}{{{B_0}}} + \frac{1}{{{A_i}}}-\frac{1}{{{B_i}}} $ |
通過公式(3)可以計算不同水平暴露組相對于參照組的效應量RR自然對數的95%CI:
$ LnR{R_i} \pm 1.96\sqrt {{V_i}} $ |
另外還需要利用表 1數據計算一下P值:非暴露組人數或人年與所有研究暴露人數或總人年的比值和Z值:所有研究暴露人數或總人年與所有發生結局人數的比值。因為一般原始研究結果都會提供不同暴露水平校正的RR值,結合A0、B0已知的情況下,利用公式(1)就可以變換成公式(4):
$ {B_i}=\frac{{{A_i}{B_0}}}{{{A_0}R{R_i}}} $ |
在公式(4)中Ai仍然是未知項,前面介紹一般原始研究結果會提供不同暴露水平校正RR值的95%CI,那么利用公式(3)就可以推算出效應量RR自然對數方差,再將公式(4)代入公式(2)中即可求出Ai:
$ {A_i}=\left({R{R_i}\frac{{{A_0}}}{{{B_0}}}-1} \right) \div \left({-V + \frac{1}{{{A_0}}}-\frac{1}{{{B_0}}}} \right) $ |
將公式(5)代入公式(2)即可求出Bi:
$ {B_i}=\left({\frac{{{B_0}}}{{{A_0}R{R_i}}}-1} \right) \div \left({{V_i} + \frac{1}{{{A_0}}} + \frac{1}{{{B_0}}}} \right) $ |
在此基礎上,再計算P’與Z':
$ P'=\frac{{{B_0}}}{{\sum\nolimits_{i=0}^n {{B_i}} }} $ |
$ Z'=\frac{{\sum\nolimits_{i=0}^n {{B_i}} }}{{\sum\nolimits_{i=0}^n {{A_i}} }} $ |
利用表 1數據獲得的P值和Z值,對下面公式(9)進行迭代,使其值無限接近于0便可得到估算的A0與B0值。
$ \left({\frac{{P-P'}}{P}} \right) + {\left({\frac{{Z-Z'}}{Z}} \right)^2} \approx 0 $ |
綜上所述,便可求得一組模擬校正混雜后的各級暴露水平發生與不發生某類結局的偽有效例數,這組數據不具有實際的意義,但通過他們重新組合成四格表計算出RR值卻與原始研究數據得出的結果基本類似。
1.2.2 多結局資料效應量合并基本原理
多結局資料效應量合并原理同樣以病例-對照研究為例,并以表 2的形式呈現研究數據,B0表示對照組非暴露人數,Bi表示不同疾病結局(Disease Category)組非暴露人數,A0表示對照組暴露人數,Ai表示不同疾病結局組暴露人數。

通過公式(10)可以計算不同疾病結局組相對于對照組的效應量OR的自然對數:
$ O{R_i}=\frac{{{A_i}{B_0}}}{{{A_0}{B_i}}} $ |
通過公式(11)可以計算不同疾病結局組相對于對照組的效應量OR自然對數方差:
$ {V_i}=\frac{1}{{{A_0}}} + \frac{1}{{{B_0}}} + \frac{1}{{{A_i}}} + \frac{1}{{{B_i}}} $ |
通過公式(12)可以計算不同疾病結局組相對于對照組的效應量OR自然對數的95%CI:
$ LnO{R_i} \pm 1.96\sqrt {{V_i}} $ |
另外還需要利用表 2數據計算一下P值:對照組非暴露人數與所有研究非暴露人數比。Z值:所有研究非暴露人數與所有研究暴露組人數比值。因為一般原始研究結果都會提供不同研究結局校正RR值,結合A0、B0已知的情況下,利用公式(10)就可以變換成公式(13):
$ {B_i}=\frac{{{A_i}{B_0}}}{{{A_0}O{R_i}}} $ |
在公式(13)中Ai仍然是未知項,前面介紹一般原始研究結果還會提供不同研究結局校正OR值95%CI,那么利用公式(12)就可以推算出效應量OR自然對數方差,再將公式(13)代入公式(11)中即可求出Ai:
$ {A_i}=\left({O{R_i}\frac{{{A_0}}}{{{B_0}}} + 1} \right) \div \left({{V_i}-\frac{1}{{{A_0}}}-\frac{1}{{{B_0}}}} \right) $ |
將公式(14)代入公式(11)即可求出Bi:
$ {B_i}=\left({\frac{{{B_0}}}{{{A_0}O{R_i}}} + 1} \right) \div \left({{V_i}-\frac{1}{{{A_0}}}-\frac{1}{{{B_0}}}} \right) $ |
在此基礎上,再計算P'與Z':
$ P'=\frac{{{B_0}}}{{\sum\nolimits_{i=0}^n {{B_i}} }} $ |
$ Z'=\frac{{\sum\nolimits_{i=0}^n {{B_i}} }}{{\sum\nolimits_{i=0}^n {{A_i}} }} $ |
利用從表 2中獲得的P值和Z值,對下面公式(18)進行迭代,使其值無限接近于0便可得到估算的A0與B0值。
$ {\left({\frac{{P-P'}}{P}} \right)^2} + {\left({\frac{{Z-Z'}}{Z}} \right)^2} \approx 0 $ |
綜上所述,便可求得一組模擬校正混雜后的不同研究結局與是否暴露某危險因素的偽有效例數,通過重新組合成新的四格表計算出的OR值與原始研究數據得出的結果基本類似。
2 實例分析
2.1 運用EXCEL宏命令實現有序暴露資料效應量合并
研究數據來自于Matthews等[6]在2012年發表的一項關于觀看電視和電腦屏幕時間與總死亡率關系的隊列研究,該研究通過對240?819名50~71歲的瑞典人進行了平均8.5年的隨訪,共有17?044人死亡。原文報道觀看屏幕時間與總死亡風險數據如表 3所示。原文將觀看屏幕時間分為了5組,進行Meta分析時,希望得到≥5 h/d與最低組相比較的校正RR值及其95%CI。

根據Greenland和Longnecker提出的理論[


2.2 運用EXCEL宏命令實現多結局資料效應量合并
研究數據來自于Fontham等[8]在1994年發表的一項關于在非吸煙女性中被動吸煙及肺癌關系的病例-對照研究,該研究共納入653名肺癌與1 253名健康對照進行分析,原文報道女性被動吸煙(Pipes)與肺癌數據如表 4所示。原文將肺癌分為腺癌和其他病理類型2類,而進行Meta分析時,希望得到所有類型肺癌對健康人相比較的校正OR值及其95%CI。

打開上述EXCEL宏程序后,錄入表 4中的校正混雜后OR及可信區間數值、健康對照組暴露與非暴露例數以及所有病例組(除健康對照組以外的所有組)的暴露與非暴露總數,將“Controls”組設定為參照,賦值為“0”,另外2個病例組(“Adenocarcinoma”、“Other histological types”)為比較組,賦值為“1”,同時設定研究類型為“Case-control”,分類水平是“Disease”,點擊“Solve”按鈕,EXCEL將進行規劃求解,自動找到最佳的解。在EXCEL表格左上角“Results for the specified contrast”部分顯示出總體肺癌組與健康對照組相比較的OR值及其95%CI為1.18(0.87,1.59),見圖 3,與原始數據再次分析結果相似[8]。

3 討論
本文提供了一種將有序暴露資料轉換為二分類暴露資料的思路與實現方法,以往遇到原始研究中暴露變量為有序變量時,原文會呈現多個有序分類相對于參照組的效應量及95%CI。進行常規的Meta分析時,遇到這類數據時,通用的處理方法大致有如下二種:一種常規的做法是,只取最高劑量相對于參照組的RR及其95%CI [9],但這種做法,損失了中間組別的信息,所得結果也粗糙,僅能提示某種暴露與結局有關系及具體的效應大小,并不能做到很精準地估計;另一種是,先利用固定效應模型或是隨機效應模型Meta分析進行組內合并,再將合并結果與其他研究進行常規Meta分析,這種處理方式錯誤地把多個組別資料看成單個獨立的研究,降低了檢驗效能。對于多結局資料效應量合并也存在著與之類似的處理方式。因此,開發出一種適合于此類數據轉換的方法顯得尤為重要。在這種情況下,由Greenland和Longnecker教授最先闡述了數據轉換原理,Hamling教授編制了專門的EXCEL宏程序來實現轉換,此轉換可基本模擬對各組別進行重新組合后原始研究的多因素分析結果,只需簡單的幾步操作便可得到與原始數據分析相似的結果,該EXCEL宏程序自發布以來,已廣泛應用于各類Meta分析的數據預處理過程中[10-14]。
另外,在進行多組別合并時,根據原始數據計算偽有效例數從數學運算上來看就是一個規劃求解的過程,也就尋求使本文公式(9)或(18)接近于零時的最優解。進行分析時,有時會出現找不以最優解的情況,主要是以下兩個原因:①求解方程從初始值開始運算使公式(9)或(18)接近于零,但達不到應有的精確度;②從初始值進行運算,始終找不到最優解。第①種情況比第②種情況更為常見,這時只需要調整一下精確度就可以了,如:把EXCEL表格中Solver Precision下拉框數值如從0.000?01調整到0.001,再重新求解就可以了。如調整精確度還不能解決,則可能是第②種情況,要先認真核對原始文獻中的數據是否抄錄有誤,必要時運用一些檢查公式對原始文獻中報道數據的真實性進行檢查,或是將初始數據(四格表中的非暴露組病例數和隨訪人年數),做一下細微調整。
限于篇幅,本文只大致介紹了隊列研究的有序暴露資料效應量和病例-對照研究多結局資料效應量合并的實現過程,其他中間結果可參考EXCEL宏程序的幫助說明書。總之,此EXCEL宏程序簡便實用,為處理這類數據提供了一種很好的實現方法。
在觀察性研究Meta分析中,經常會遇到有序暴露資料的情況,如在一項關于觀看電視和電腦屏幕時間與總死亡率關系的隊列研究中,觀看屏幕的時間分為“< 1 h/d”、“1~2 h/d”、“3~4 h/d”、“5~6 h/d”、“≥7 h/d”五個組別,原始研究只提供了相對于最低組別(“< 1 h/d”),其他各組調整相關混雜因素的效應量(如OR或RR)及其95%CI。而在Meta分析中,希望原始研究提供觀看屏幕時間≥5 h/d與最低組相比較的校正RR值及其95%CI。這時,如果簡單將“5~6 h/d”、“≥7 h/d”兩組用固定效應模型合并是不可取的,因為觀看屏幕時間的五個分類不是獨立的數據,而是一組有序的相關數據,不能進行簡單的合并[1]。與此類似,當評價被動吸煙與肺癌的關系時,原始研究給出的結局指標是不同的肺癌病理類型:“鱗癌”、“腺癌”、“小細胞癌”、“大細胞癌”、“其他癌”的多因素分析效應量及其95%CI,而Meta分析希望得到是僅僅是吸煙與所有肺癌的效應量與95%CI。如果簡單地將各種病理類型的效應量用固定效應模型進行合并也是不可取的。這兩種類型數據在劑量反應Meta分析[2-4]中隨處可見,尋找合適的轉換方法,將極大推動此類Meta分析的發表,本文將對轉換的原理與方法作一介紹,以期為解決此類問題提供指導。
1 思路與原理
1.1 處理思路
1.1.1 有序暴露資料效應量合并處理思路
流行病學研究中探討有序暴露水平與發生某類結局(疾病)關系的研究論文中常呈現這些信息:①多因素統計分析調整多種混雜后,以最低或最高水平暴露組作為參照,其他組別均與之對比的效應量(OR或RR)及其95%CI;②各級暴露水平發生與不發生某類結局的例數。為了將有序暴露資料不同組別進行再次組合分析(如前言中將五分類觀看屏幕時間數據轉換成≥5 h/d與最低組相比較的情況),Greenland和Longnecker [5]提出了一種解決方案:利用原始研究中提供的數據①與數據②通過數學規劃求解產生一組模擬校正混雜后的各級暴露水平發生與不發生某類結局的偽有效例數,再利用這些偽有效例數估計再次組合情況下的暴露情況與發生某類結局的效應量及95%CI。
1.1.2 多結局資料效應量合并處理思路
探討暴露因素與多結局資料原始研究提供的數據一般是:①多因素統計分析調整多種混雜后,以健康組或某類疾病組作為參照,其他組別均與之對比的效應量及其95%CI;②不同疾病結局組與是否暴露的例數。為了將不同結局組別進行再次組合分析(如前言中將“正常組”、“鱗癌”、“腺癌”、“小細胞癌”、“大細胞癌”、“其他癌”六分類結局資料轉換為“正常組”和“肺癌組”二分類情況)分析思路也是先利用原始研究中提供的數據①與數據②通過數學規劃求解產生一組模擬校正混雜后的不同結局組別與是否暴露的偽有效例數,再利用這些偽有效例數估計再次組合情況下的不同結局與危險因素暴露的效應量及95%CI。
1.2 基本原理
1.2.1 有序暴露資料效應量合并基本原理
此轉換主要是應用于流行病學研究中的病例-對照研究、隊列研究二種類型,本文以隊列研究為例對其基本原理作一介紹,病例-對照研究情況可依此類推。
隊列研究常以表 1的形式呈現研究數據,B0表示非暴露組人數或人年,Bi表示不同水平暴露組人數或人年,A0表示非暴露組發生研究結局的人數,Ai表示不同水平暴露組發生研究結局的人數。

通過公式(1)可以計算不同水平暴露組相對于參照組的效應量RR的自然對數:
$ LnR{R_i}=\ln \left({\frac{{{A_i}{B_0}}}{{{A_0}{B_i}}}} \right) $ |
通過公式(2)可以計算不同水平暴露組相對于參照組的效應量RR自然對數方差:
$ {V_i}=\frac{1}{{{A_0}}}-\frac{1}{{{B_0}}} + \frac{1}{{{A_i}}}-\frac{1}{{{B_i}}} $ |
通過公式(3)可以計算不同水平暴露組相對于參照組的效應量RR自然對數的95%CI:
$ LnR{R_i} \pm 1.96\sqrt {{V_i}} $ |
另外還需要利用表 1數據計算一下P值:非暴露組人數或人年與所有研究暴露人數或總人年的比值和Z值:所有研究暴露人數或總人年與所有發生結局人數的比值。因為一般原始研究結果都會提供不同暴露水平校正的RR值,結合A0、B0已知的情況下,利用公式(1)就可以變換成公式(4):
$ {B_i}=\frac{{{A_i}{B_0}}}{{{A_0}R{R_i}}} $ |
在公式(4)中Ai仍然是未知項,前面介紹一般原始研究結果會提供不同暴露水平校正RR值的95%CI,那么利用公式(3)就可以推算出效應量RR自然對數方差,再將公式(4)代入公式(2)中即可求出Ai:
$ {A_i}=\left({R{R_i}\frac{{{A_0}}}{{{B_0}}}-1} \right) \div \left({-V + \frac{1}{{{A_0}}}-\frac{1}{{{B_0}}}} \right) $ |
將公式(5)代入公式(2)即可求出Bi:
$ {B_i}=\left({\frac{{{B_0}}}{{{A_0}R{R_i}}}-1} \right) \div \left({{V_i} + \frac{1}{{{A_0}}} + \frac{1}{{{B_0}}}} \right) $ |
在此基礎上,再計算P’與Z':
$ P'=\frac{{{B_0}}}{{\sum\nolimits_{i=0}^n {{B_i}} }} $ |
$ Z'=\frac{{\sum\nolimits_{i=0}^n {{B_i}} }}{{\sum\nolimits_{i=0}^n {{A_i}} }} $ |
利用表 1數據獲得的P值和Z值,對下面公式(9)進行迭代,使其值無限接近于0便可得到估算的A0與B0值。
$ \left({\frac{{P-P'}}{P}} \right) + {\left({\frac{{Z-Z'}}{Z}} \right)^2} \approx 0 $ |
綜上所述,便可求得一組模擬校正混雜后的各級暴露水平發生與不發生某類結局的偽有效例數,這組數據不具有實際的意義,但通過他們重新組合成四格表計算出RR值卻與原始研究數據得出的結果基本類似。
1.2.2 多結局資料效應量合并基本原理
多結局資料效應量合并原理同樣以病例-對照研究為例,并以表 2的形式呈現研究數據,B0表示對照組非暴露人數,Bi表示不同疾病結局(Disease Category)組非暴露人數,A0表示對照組暴露人數,Ai表示不同疾病結局組暴露人數。

通過公式(10)可以計算不同疾病結局組相對于對照組的效應量OR的自然對數:
$ O{R_i}=\frac{{{A_i}{B_0}}}{{{A_0}{B_i}}} $ |
通過公式(11)可以計算不同疾病結局組相對于對照組的效應量OR自然對數方差:
$ {V_i}=\frac{1}{{{A_0}}} + \frac{1}{{{B_0}}} + \frac{1}{{{A_i}}} + \frac{1}{{{B_i}}} $ |
通過公式(12)可以計算不同疾病結局組相對于對照組的效應量OR自然對數的95%CI:
$ LnO{R_i} \pm 1.96\sqrt {{V_i}} $ |
另外還需要利用表 2數據計算一下P值:對照組非暴露人數與所有研究非暴露人數比。Z值:所有研究非暴露人數與所有研究暴露組人數比值。因為一般原始研究結果都會提供不同研究結局校正RR值,結合A0、B0已知的情況下,利用公式(10)就可以變換成公式(13):
$ {B_i}=\frac{{{A_i}{B_0}}}{{{A_0}O{R_i}}} $ |
在公式(13)中Ai仍然是未知項,前面介紹一般原始研究結果還會提供不同研究結局校正OR值95%CI,那么利用公式(12)就可以推算出效應量OR自然對數方差,再將公式(13)代入公式(11)中即可求出Ai:
$ {A_i}=\left({O{R_i}\frac{{{A_0}}}{{{B_0}}} + 1} \right) \div \left({{V_i}-\frac{1}{{{A_0}}}-\frac{1}{{{B_0}}}} \right) $ |
將公式(14)代入公式(11)即可求出Bi:
$ {B_i}=\left({\frac{{{B_0}}}{{{A_0}O{R_i}}} + 1} \right) \div \left({{V_i}-\frac{1}{{{A_0}}}-\frac{1}{{{B_0}}}} \right) $ |
在此基礎上,再計算P'與Z':
$ P'=\frac{{{B_0}}}{{\sum\nolimits_{i=0}^n {{B_i}} }} $ |
$ Z'=\frac{{\sum\nolimits_{i=0}^n {{B_i}} }}{{\sum\nolimits_{i=0}^n {{A_i}} }} $ |
利用從表 2中獲得的P值和Z值,對下面公式(18)進行迭代,使其值無限接近于0便可得到估算的A0與B0值。
$ {\left({\frac{{P-P'}}{P}} \right)^2} + {\left({\frac{{Z-Z'}}{Z}} \right)^2} \approx 0 $ |
綜上所述,便可求得一組模擬校正混雜后的不同研究結局與是否暴露某危險因素的偽有效例數,通過重新組合成新的四格表計算出的OR值與原始研究數據得出的結果基本類似。
2 實例分析
2.1 運用EXCEL宏命令實現有序暴露資料效應量合并
研究數據來自于Matthews等[6]在2012年發表的一項關于觀看電視和電腦屏幕時間與總死亡率關系的隊列研究,該研究通過對240?819名50~71歲的瑞典人進行了平均8.5年的隨訪,共有17?044人死亡。原文報道觀看屏幕時間與總死亡風險數據如表 3所示。原文將觀看屏幕時間分為了5組,進行Meta分析時,希望得到≥5 h/d與最低組相比較的校正RR值及其95%CI。

根據Greenland和Longnecker提出的理論[


2.2 運用EXCEL宏命令實現多結局資料效應量合并
研究數據來自于Fontham等[8]在1994年發表的一項關于在非吸煙女性中被動吸煙及肺癌關系的病例-對照研究,該研究共納入653名肺癌與1 253名健康對照進行分析,原文報道女性被動吸煙(Pipes)與肺癌數據如表 4所示。原文將肺癌分為腺癌和其他病理類型2類,而進行Meta分析時,希望得到所有類型肺癌對健康人相比較的校正OR值及其95%CI。

打開上述EXCEL宏程序后,錄入表 4中的校正混雜后OR及可信區間數值、健康對照組暴露與非暴露例數以及所有病例組(除健康對照組以外的所有組)的暴露與非暴露總數,將“Controls”組設定為參照,賦值為“0”,另外2個病例組(“Adenocarcinoma”、“Other histological types”)為比較組,賦值為“1”,同時設定研究類型為“Case-control”,分類水平是“Disease”,點擊“Solve”按鈕,EXCEL將進行規劃求解,自動找到最佳的解。在EXCEL表格左上角“Results for the specified contrast”部分顯示出總體肺癌組與健康對照組相比較的OR值及其95%CI為1.18(0.87,1.59),見圖 3,與原始數據再次分析結果相似[8]。

3 討論
本文提供了一種將有序暴露資料轉換為二分類暴露資料的思路與實現方法,以往遇到原始研究中暴露變量為有序變量時,原文會呈現多個有序分類相對于參照組的效應量及95%CI。進行常規的Meta分析時,遇到這類數據時,通用的處理方法大致有如下二種:一種常規的做法是,只取最高劑量相對于參照組的RR及其95%CI [9],但這種做法,損失了中間組別的信息,所得結果也粗糙,僅能提示某種暴露與結局有關系及具體的效應大小,并不能做到很精準地估計;另一種是,先利用固定效應模型或是隨機效應模型Meta分析進行組內合并,再將合并結果與其他研究進行常規Meta分析,這種處理方式錯誤地把多個組別資料看成單個獨立的研究,降低了檢驗效能。對于多結局資料效應量合并也存在著與之類似的處理方式。因此,開發出一種適合于此類數據轉換的方法顯得尤為重要。在這種情況下,由Greenland和Longnecker教授最先闡述了數據轉換原理,Hamling教授編制了專門的EXCEL宏程序來實現轉換,此轉換可基本模擬對各組別進行重新組合后原始研究的多因素分析結果,只需簡單的幾步操作便可得到與原始數據分析相似的結果,該EXCEL宏程序自發布以來,已廣泛應用于各類Meta分析的數據預處理過程中[10-14]。
另外,在進行多組別合并時,根據原始數據計算偽有效例數從數學運算上來看就是一個規劃求解的過程,也就尋求使本文公式(9)或(18)接近于零時的最優解。進行分析時,有時會出現找不以最優解的情況,主要是以下兩個原因:①求解方程從初始值開始運算使公式(9)或(18)接近于零,但達不到應有的精確度;②從初始值進行運算,始終找不到最優解。第①種情況比第②種情況更為常見,這時只需要調整一下精確度就可以了,如:把EXCEL表格中Solver Precision下拉框數值如從0.000?01調整到0.001,再重新求解就可以了。如調整精確度還不能解決,則可能是第②種情況,要先認真核對原始文獻中的數據是否抄錄有誤,必要時運用一些檢查公式對原始文獻中報道數據的真實性進行檢查,或是將初始數據(四格表中的非暴露組病例數和隨訪人年數),做一下細微調整。
限于篇幅,本文只大致介紹了隊列研究的有序暴露資料效應量和病例-對照研究多結局資料效應量合并的實現過程,其他中間結果可參考EXCEL宏程序的幫助說明書。總之,此EXCEL宏程序簡便實用,為處理這類數據提供了一種很好的實現方法。