引用本文: 劉朝, 吳遠, 楊金生, 齊淑蘭, 王瑩瑩. 國內外戒煙臨床隨機對照試驗結局指標報告文獻分析. 中國循證醫學雜志, 2015, 15(6): 730-734. doi: 10.7507/1672-2531.20150121 復制
吸煙對健康的危害是全社會關注的重大公共衛生問題。全世界每年因吸煙病死的人數達500多萬[1],吸煙是引發慢性阻塞性肺病、慢性支氣管炎、高血壓、冠心病等疾病的重要誘因,也是呼吸、心血管病第一位可預防的死亡危險因素[2]。據衛生部《2013年中國控制吸煙報告》報道[3],至2010年末,我國吸煙者多達3億,占全球吸煙總人數的1/3,預計到2020年我國每年將有200萬人死于吸煙相關疾病。目前,國內外均有關于戒煙的臨床隨機對照試驗(randomized controlled trial,RCT)發表,但因戒煙機制復雜、需長期觀測等特點,各RCT無論從其治療方法、試驗設計還是評價指標,都不盡相同。此外,對評價指標選擇的不同可能會造成對治療結果的不同解讀。為此,本研究采用系統評價的方法,對國內外戒煙的RCT的評價指標進行分析,以期為對戒煙相關RCT的設計提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
研究類型:RCT。研究對象:診斷為尼古丁依賴,或者以戒煙為研究目的,年齡、性別、來源等不限。
1.1.2 排除標準
僅有摘要而未找到全文的文獻;研究對象患有除尼古丁依賴以外的其他嚴重疾病;重復發表的文獻。
1.2 文獻檢索
計算機檢索CNKI、WanFang Data、VIP、PubMed、ScienceDirect、EMbase和SpringLink數據庫,查找戒煙相關的RCT,檢索時限自1998年1月至2013年12月。中文檢索詞包括:戒煙、尼古丁依賴、煙草、隨機臨床試驗;英文檢索詞包括:smoking、cigarette、tobacco、nicotine dependence、randomized clinical trial。
1.3 文獻篩選與資料提取
由兩位研究者獨立按照納入與排除標準篩選文獻和提取資料,并交叉核對,若遇分歧討論解決。根據結局評價指標的含義[4],將納入文獻所涉及的指標分為基線指標(用于描述治療前受試者資料的指標)、療效評價指標(用于描述治療結束時受試者療效的指標)與隨訪指標(用于描述治療結束后受試者療效的指標)。對于基線指標,根據文獻是否描述按“報告”或者“未報告”進行記錄;對于療效評價指標,因為根據檢測方法的不同,分為點戒斷率、持續戒斷率和延長戒斷率分別記錄。對于隨訪指標,根據文獻是否描述按“報告”或者“未報告”進行記錄。
1.4 統計分析
采用Excel 2007軟件進行數據的整理與錄入,采用SPSS 19.0軟件進行統計分析。計數資料以頻率和百分比表示,計量資料以均數±標準差(
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻1 149篇,經逐層篩選,最終納入68個RCT。文獻篩選流程及結果見圖 1。

2.2 文獻發表情況
納入的英文文獻來自10個國家/地區,依次為美國(17篇)、英國(5篇)和加拿大(5篇)等;主要發表在《Drug and Alcohol Dependence》(6篇)、《Preventive Medicine》(5篇)、《Lancet》(5篇)和《Addictive Behaviors》(4篇)等雜志上。納入的中文文獻來自14個省市,發表在22種期刊上,其中載文量最多的是《中國新藥與臨床雜志》(3篇)。
2.3 基線指標報告情況
納入RCT的基線指標報告情況見表 1。由表 1可見,總體基線指標報告率前5位依次為年齡、性別、每日吸煙數、煙齡和尼古丁依賴檢測量表(FTND),中文RCT基線指標報告率前5位依次為年齡、性別、煙齡、每日吸煙數和FTND,英文RCT基線指標報告率前5位依次為年齡、性別、每日吸煙數、FTND和教育程度。中、英文RCT相比,除煙齡的報告率中文RCT明顯高于英文RCT(P<0.05)外,種族、教育程度、吸煙起始年齡、嘗試戒煙次數、有無其他基礎病、FTND、渴求量表和戒煙日的報告率英文RCT均明顯高于中文RCT(P均<0.05)。

2.4 療效評價指標報告情況
納入RCT的療效評價指標報告情況見表 2。由表 2可知,納入RCT報告的療效評價指標主要為持續戒斷率(57次),其次為點戒斷率(41次)。中文RCT更多報告持續戒斷率(21次);而英文RCT點戒斷率(39次)和持續戒斷率(36次)的報告相當,29.3%(12/41)同時報告了點戒斷率和持續戒斷率。

2.5 隨訪指標報告情況
納入RCT的隨訪指標報告情況見表 3。由表 3可知,有15個RCT(22.4%)未進行隨訪,18個中文RCT(66.7%)和35個英文RCT(85.4%)共報告了5個方面的隨訪內容:隨訪時間、隨訪人數、隨訪方式、隨訪評價指標及其指標測定方式。隨訪時間多選擇24周以內;41.2%的RCT未說明隨訪方式。隨訪指標主要是戒斷率 ,中英文RCT差異無統計學意義(P>0.05)。指標測定方面中文RCT多為受試者自我報告,而英文RCT則以呼出CO含量為主。

3 討論
結局指標評價(outcome assessment)是目前新的研究熱點,因恰當的結局評價指標是臨床試驗的重要環節,采用不同的指標可能得到有效或無效的結論[5]。結局評價指標是指事先預設的被認為是對試驗相關的各方(如患者、試驗決策者、醫生、資助人等)最重要的指標 [6]。狹義的結局評價指標是指治療結束時選擇的評價指標,廣義的還應包括治療前納入受試者的基線資料指標和隨訪資料的評價指標。因此本次研究將近16年來發表的戒煙RCT的結局評價指標按上述分類方法進行整理和分析。
基線指標是描述受試者一般資料(基線)的指標,其意義一方面在于詳細的基線信息可以體現該臨床試驗受試者接受治療前的同質性,為其結論提供可靠的保障;另一方面,煙草依賴屬于一種典型的慢性、依賴性、系統性疾病,吸煙者多處于亞健康狀況,較傳統的傳染性疾病更為復雜,往往缺少明確的致病因素,所以現代醫學越來越倚重通過基線資料尋找與該病高度相關的誘因來預防慢性疾病的發生。如Castaldelli-Maia等[7]關于戒煙預測因子的報告指出,只有起床后5 min是否抽煙這一項對于預測受試者是否能夠成功戒煙密切相關,但是其他報告[8, 9]指出性別、種族、FTND、居住環境(城鎮/鄉村)、教育程度、婚姻情況可能與戒煙成功率密切相關,同時還有研究者發現[10],不同種族間吸煙預測因子亦不同。因此全面的基線資料報告對臨床試驗具有重要意義。
但本研究發現,RCT在基線指標的選擇上存在明顯不足,尤其是受試者的婚姻狀況、教育程度、工作和戒煙歷史已被證實與吸煙密切相關的指標往往得不到應有的重視。因此在進行戒煙研究時,推薦使用具有較高信度和效度的量表[11-13]以期更好地記錄受試者的基線資料,以客觀評價臨床試驗的結果。
目前,為判定戒煙者是否吸煙,常用的方法有詢問法、環境標記物檢測法以及生物標記物檢測法3大類[14]。考慮到臨床實踐,通常以戒煙者的自我報告配合生化檢測(例如尿可替寧)為主。可替寧是尼古丁的主要代謝產物,存在于吸煙、咀嚼煙葉或被動吸煙者的血液、尿液、唾液和頭發中,可以通過檢測個人的生物標本(尿液、血液、唾液、頭發等)來反映個人主動和被動吸煙的程度。與其他方法比較,其優點為:① 它是尼古丁攝入的特異指標,可以反映體內尼古丁實際攝入量,且研究證明其他食物產生的尼古丁對煙草來源的尼古丁沒有顯著影響;② 比直接尼古丁檢測更好,它在血液中的平均生物學半衰期為19 h,體液中1 d內的濃度變化僅為15%~20%,因此可以作為一種綜合指標,反映在停留的被動吸煙場所的暴露水平。其不足之處包括:① 結果不能區分主動吸煙和被動吸煙,因為主動吸煙和被動吸煙均可使體液中可替丁濃度升高。② 影響因素多,服用尼古丁戒煙藥物、飲食習慣、個體差異均可影響結果;③ 檢測結果僅能反映3 d左右被動吸煙的情況,不能反映長期變化情況;④ 設備技術條件要求較高、需要較多的經費支持才能很好的完成。
因此Velicer等[15]在1992年提出將戒斷率分為持續戒斷率(continuous abstinence rate)、點戒斷率(point abstinence rate)、延長戒斷率(prolonged abstinence rate),并建議不同RCT依據自己的特點選擇適合的戒斷指標。持續戒斷率是指戒煙者在戒煙開始直到結束時都保持戒煙狀態,多依靠患者的自身報告;延長戒斷率是指在戒煙開始后,設定一個緩沖區(一般1周左右),戒煙者可在戒煙開始后繼續吸煙,但在緩沖區結束時應保持戒斷狀態;點戒斷率是指規定患者在特定的檢測日進行生化指標測定,一般以呼出CO或可替丁含量為主,來判斷前一段時間(7 d或24 h時)是否處于戒斷狀態。在過去20年里,關于點戒斷率、持續戒斷率和延長戒斷率優劣的爭論一直存在。有研究者認為,持續戒斷率應成為戒斷率的金標準[16, 17],因為它覆蓋時間長,能反映戒斷療法的長期效應,另一方面因為呼出CO含量和尿可替丁這種生化指標檢測的客觀性,使點戒斷率的使用可靠性優于持續戒斷率[18]。延長戒斷率的優勢則在于緩沖區的設置,有研究發現,部分成功戒煙的受試者,在戒斷早期都有復吸現象,使用其他戒斷率指標則會將其歸入復吸者行列,而部分藥物也具有延遲效應,使用延長戒斷率也能彌補其不足[19]。
隨訪是臨床研究的重要組成部分,因為吸煙的長期性、終身性,對其治療效果的長期觀測的重要性甚至要大于對其短期療效的觀察[20-22],這也與本次研究中發現的77.9%(53/68)的臨床試驗進行了隨訪相符合。
在進行隨訪的RCT中,大多中文RCT選擇了12周,英文RCT選擇了24周及以上作為隨訪時間。理論上,隨訪時間越長,越能體現戒煙療法的長期效果,但問題是究竟多長的時間是值得的[26]。部分研究[23]發現,戒斷治療結束1年后依舊會出現復吸情況,因此選擇48周的隨訪時間可以反映戒煙的長期效果,而且臨床結論更有說服力;選擇24周的隨訪時間的優勢在于多個Meta分析[24-26]表明24周的隨訪時間已經足夠。
在隨訪的療效評價指標上,雖然依舊以戒斷率為主,由于隨訪的特殊性而有所區別[23]。治療結束時,為突出治療效果,選擇戒斷率以達到簡潔、準確的目的。而在隨訪期間,其目的在于觀察長期效果與趨勢,可以使用其他如趨勢圖的方式來提供額外的信息[27, 28]。
因此,本次研究初步認為以下的隨訪設置最優:至少24周的隨訪時間,以戒斷率為主多種指標(每日吸煙量、FTND量表等)并存,門診預約的隨訪方式,呼出CO或可替丁含量等生化檢測作為測定方式。
除了探討戒煙RCT結局指標的選擇,本次研究還旨在對比中外RCT指標選擇上的差異。對于基線指標,中英文RCT在種族、教育程度、煙齡、吸煙起始年齡、嘗試戒煙次數、有無其他基礎病和FTND的選擇上有顯著差異(P均<0.05)。對于療效評價指標,中文RCT主要使用持續戒斷率,而英文RCT多同時使用點戒斷率和持續戒斷率,其結果更客觀、可靠。對于隨訪指標,中英文RCT在選擇上存在很大區別。綜合上述三類指標的選擇,我們認為英文RCT優于中文RCT。
綜上所述,目前戒煙相關RCT結局指標的選擇存在差異,多數不同程度存在不足,中文RCT差于英文RCT,需在今后的臨床試驗中加以注意和改進。
吸煙對健康的危害是全社會關注的重大公共衛生問題。全世界每年因吸煙病死的人數達500多萬[1],吸煙是引發慢性阻塞性肺病、慢性支氣管炎、高血壓、冠心病等疾病的重要誘因,也是呼吸、心血管病第一位可預防的死亡危險因素[2]。據衛生部《2013年中國控制吸煙報告》報道[3],至2010年末,我國吸煙者多達3億,占全球吸煙總人數的1/3,預計到2020年我國每年將有200萬人死于吸煙相關疾病。目前,國內外均有關于戒煙的臨床隨機對照試驗(randomized controlled trial,RCT)發表,但因戒煙機制復雜、需長期觀測等特點,各RCT無論從其治療方法、試驗設計還是評價指標,都不盡相同。此外,對評價指標選擇的不同可能會造成對治療結果的不同解讀。為此,本研究采用系統評價的方法,對國內外戒煙的RCT的評價指標進行分析,以期為對戒煙相關RCT的設計提供參考依據。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
研究類型:RCT。研究對象:診斷為尼古丁依賴,或者以戒煙為研究目的,年齡、性別、來源等不限。
1.1.2 排除標準
僅有摘要而未找到全文的文獻;研究對象患有除尼古丁依賴以外的其他嚴重疾病;重復發表的文獻。
1.2 文獻檢索
計算機檢索CNKI、WanFang Data、VIP、PubMed、ScienceDirect、EMbase和SpringLink數據庫,查找戒煙相關的RCT,檢索時限自1998年1月至2013年12月。中文檢索詞包括:戒煙、尼古丁依賴、煙草、隨機臨床試驗;英文檢索詞包括:smoking、cigarette、tobacco、nicotine dependence、randomized clinical trial。
1.3 文獻篩選與資料提取
由兩位研究者獨立按照納入與排除標準篩選文獻和提取資料,并交叉核對,若遇分歧討論解決。根據結局評價指標的含義[4],將納入文獻所涉及的指標分為基線指標(用于描述治療前受試者資料的指標)、療效評價指標(用于描述治療結束時受試者療效的指標)與隨訪指標(用于描述治療結束后受試者療效的指標)。對于基線指標,根據文獻是否描述按“報告”或者“未報告”進行記錄;對于療效評價指標,因為根據檢測方法的不同,分為點戒斷率、持續戒斷率和延長戒斷率分別記錄。對于隨訪指標,根據文獻是否描述按“報告”或者“未報告”進行記錄。
1.4 統計分析
采用Excel 2007軟件進行數據的整理與錄入,采用SPSS 19.0軟件進行統計分析。計數資料以頻率和百分比表示,計量資料以均數±標準差(
2 結果
2.1 文獻檢索結果
初檢共獲得相關文獻1 149篇,經逐層篩選,最終納入68個RCT。文獻篩選流程及結果見圖 1。

2.2 文獻發表情況
納入的英文文獻來自10個國家/地區,依次為美國(17篇)、英國(5篇)和加拿大(5篇)等;主要發表在《Drug and Alcohol Dependence》(6篇)、《Preventive Medicine》(5篇)、《Lancet》(5篇)和《Addictive Behaviors》(4篇)等雜志上。納入的中文文獻來自14個省市,發表在22種期刊上,其中載文量最多的是《中國新藥與臨床雜志》(3篇)。
2.3 基線指標報告情況
納入RCT的基線指標報告情況見表 1。由表 1可見,總體基線指標報告率前5位依次為年齡、性別、每日吸煙數、煙齡和尼古丁依賴檢測量表(FTND),中文RCT基線指標報告率前5位依次為年齡、性別、煙齡、每日吸煙數和FTND,英文RCT基線指標報告率前5位依次為年齡、性別、每日吸煙數、FTND和教育程度。中、英文RCT相比,除煙齡的報告率中文RCT明顯高于英文RCT(P<0.05)外,種族、教育程度、吸煙起始年齡、嘗試戒煙次數、有無其他基礎病、FTND、渴求量表和戒煙日的報告率英文RCT均明顯高于中文RCT(P均<0.05)。

2.4 療效評價指標報告情況
納入RCT的療效評價指標報告情況見表 2。由表 2可知,納入RCT報告的療效評價指標主要為持續戒斷率(57次),其次為點戒斷率(41次)。中文RCT更多報告持續戒斷率(21次);而英文RCT點戒斷率(39次)和持續戒斷率(36次)的報告相當,29.3%(12/41)同時報告了點戒斷率和持續戒斷率。

2.5 隨訪指標報告情況
納入RCT的隨訪指標報告情況見表 3。由表 3可知,有15個RCT(22.4%)未進行隨訪,18個中文RCT(66.7%)和35個英文RCT(85.4%)共報告了5個方面的隨訪內容:隨訪時間、隨訪人數、隨訪方式、隨訪評價指標及其指標測定方式。隨訪時間多選擇24周以內;41.2%的RCT未說明隨訪方式。隨訪指標主要是戒斷率 ,中英文RCT差異無統計學意義(P>0.05)。指標測定方面中文RCT多為受試者自我報告,而英文RCT則以呼出CO含量為主。

3 討論
結局指標評價(outcome assessment)是目前新的研究熱點,因恰當的結局評價指標是臨床試驗的重要環節,采用不同的指標可能得到有效或無效的結論[5]。結局評價指標是指事先預設的被認為是對試驗相關的各方(如患者、試驗決策者、醫生、資助人等)最重要的指標 [6]。狹義的結局評價指標是指治療結束時選擇的評價指標,廣義的還應包括治療前納入受試者的基線資料指標和隨訪資料的評價指標。因此本次研究將近16年來發表的戒煙RCT的結局評價指標按上述分類方法進行整理和分析。
基線指標是描述受試者一般資料(基線)的指標,其意義一方面在于詳細的基線信息可以體現該臨床試驗受試者接受治療前的同質性,為其結論提供可靠的保障;另一方面,煙草依賴屬于一種典型的慢性、依賴性、系統性疾病,吸煙者多處于亞健康狀況,較傳統的傳染性疾病更為復雜,往往缺少明確的致病因素,所以現代醫學越來越倚重通過基線資料尋找與該病高度相關的誘因來預防慢性疾病的發生。如Castaldelli-Maia等[7]關于戒煙預測因子的報告指出,只有起床后5 min是否抽煙這一項對于預測受試者是否能夠成功戒煙密切相關,但是其他報告[8, 9]指出性別、種族、FTND、居住環境(城鎮/鄉村)、教育程度、婚姻情況可能與戒煙成功率密切相關,同時還有研究者發現[10],不同種族間吸煙預測因子亦不同。因此全面的基線資料報告對臨床試驗具有重要意義。
但本研究發現,RCT在基線指標的選擇上存在明顯不足,尤其是受試者的婚姻狀況、教育程度、工作和戒煙歷史已被證實與吸煙密切相關的指標往往得不到應有的重視。因此在進行戒煙研究時,推薦使用具有較高信度和效度的量表[11-13]以期更好地記錄受試者的基線資料,以客觀評價臨床試驗的結果。
目前,為判定戒煙者是否吸煙,常用的方法有詢問法、環境標記物檢測法以及生物標記物檢測法3大類[14]。考慮到臨床實踐,通常以戒煙者的自我報告配合生化檢測(例如尿可替寧)為主。可替寧是尼古丁的主要代謝產物,存在于吸煙、咀嚼煙葉或被動吸煙者的血液、尿液、唾液和頭發中,可以通過檢測個人的生物標本(尿液、血液、唾液、頭發等)來反映個人主動和被動吸煙的程度。與其他方法比較,其優點為:① 它是尼古丁攝入的特異指標,可以反映體內尼古丁實際攝入量,且研究證明其他食物產生的尼古丁對煙草來源的尼古丁沒有顯著影響;② 比直接尼古丁檢測更好,它在血液中的平均生物學半衰期為19 h,體液中1 d內的濃度變化僅為15%~20%,因此可以作為一種綜合指標,反映在停留的被動吸煙場所的暴露水平。其不足之處包括:① 結果不能區分主動吸煙和被動吸煙,因為主動吸煙和被動吸煙均可使體液中可替丁濃度升高。② 影響因素多,服用尼古丁戒煙藥物、飲食習慣、個體差異均可影響結果;③ 檢測結果僅能反映3 d左右被動吸煙的情況,不能反映長期變化情況;④ 設備技術條件要求較高、需要較多的經費支持才能很好的完成。
因此Velicer等[15]在1992年提出將戒斷率分為持續戒斷率(continuous abstinence rate)、點戒斷率(point abstinence rate)、延長戒斷率(prolonged abstinence rate),并建議不同RCT依據自己的特點選擇適合的戒斷指標。持續戒斷率是指戒煙者在戒煙開始直到結束時都保持戒煙狀態,多依靠患者的自身報告;延長戒斷率是指在戒煙開始后,設定一個緩沖區(一般1周左右),戒煙者可在戒煙開始后繼續吸煙,但在緩沖區結束時應保持戒斷狀態;點戒斷率是指規定患者在特定的檢測日進行生化指標測定,一般以呼出CO或可替丁含量為主,來判斷前一段時間(7 d或24 h時)是否處于戒斷狀態。在過去20年里,關于點戒斷率、持續戒斷率和延長戒斷率優劣的爭論一直存在。有研究者認為,持續戒斷率應成為戒斷率的金標準[16, 17],因為它覆蓋時間長,能反映戒斷療法的長期效應,另一方面因為呼出CO含量和尿可替丁這種生化指標檢測的客觀性,使點戒斷率的使用可靠性優于持續戒斷率[18]。延長戒斷率的優勢則在于緩沖區的設置,有研究發現,部分成功戒煙的受試者,在戒斷早期都有復吸現象,使用其他戒斷率指標則會將其歸入復吸者行列,而部分藥物也具有延遲效應,使用延長戒斷率也能彌補其不足[19]。
隨訪是臨床研究的重要組成部分,因為吸煙的長期性、終身性,對其治療效果的長期觀測的重要性甚至要大于對其短期療效的觀察[20-22],這也與本次研究中發現的77.9%(53/68)的臨床試驗進行了隨訪相符合。
在進行隨訪的RCT中,大多中文RCT選擇了12周,英文RCT選擇了24周及以上作為隨訪時間。理論上,隨訪時間越長,越能體現戒煙療法的長期效果,但問題是究竟多長的時間是值得的[26]。部分研究[23]發現,戒斷治療結束1年后依舊會出現復吸情況,因此選擇48周的隨訪時間可以反映戒煙的長期效果,而且臨床結論更有說服力;選擇24周的隨訪時間的優勢在于多個Meta分析[24-26]表明24周的隨訪時間已經足夠。
在隨訪的療效評價指標上,雖然依舊以戒斷率為主,由于隨訪的特殊性而有所區別[23]。治療結束時,為突出治療效果,選擇戒斷率以達到簡潔、準確的目的。而在隨訪期間,其目的在于觀察長期效果與趨勢,可以使用其他如趨勢圖的方式來提供額外的信息[27, 28]。
因此,本次研究初步認為以下的隨訪設置最優:至少24周的隨訪時間,以戒斷率為主多種指標(每日吸煙量、FTND量表等)并存,門診預約的隨訪方式,呼出CO或可替丁含量等生化檢測作為測定方式。
除了探討戒煙RCT結局指標的選擇,本次研究還旨在對比中外RCT指標選擇上的差異。對于基線指標,中英文RCT在種族、教育程度、煙齡、吸煙起始年齡、嘗試戒煙次數、有無其他基礎病和FTND的選擇上有顯著差異(P均<0.05)。對于療效評價指標,中文RCT主要使用持續戒斷率,而英文RCT多同時使用點戒斷率和持續戒斷率,其結果更客觀、可靠。對于隨訪指標,中英文RCT在選擇上存在很大區別。綜合上述三類指標的選擇,我們認為英文RCT優于中文RCT。
綜上所述,目前戒煙相關RCT結局指標的選擇存在差異,多數不同程度存在不足,中文RCT差于英文RCT,需在今后的臨床試驗中加以注意和改進。