引用本文: 曾力楠, 李幼平, 張伶俐, 黃亮, 吳桐. 國內外制訂臨床指南的指南的循證評價. 中國循證醫學雜志, 2016, 16(11): 1322-1330. doi: 10.7507/1672-2531.20160200 復制
臨床指南即通過系統方法學制訂出的指導意見,用以輔助臨床實踐者和患者做出最適宜的衛生保健決策[1]。通過制訂和推廣適用且方便使用的臨床指南,可影響公共衛生決策,普及合理的衛生干預措施,從而不僅提升醫療服務質量,也可促進不同經濟發展水平地區間衛生服務內容和質量的一致性,提高衛生服務效率,保障衛生服務公平性。臨床指南能否正確發揮作用,高度取決于指南制訂的方法與質量。研究顯示:缺乏指南制訂標準可導致相同疾病指南間推薦意見差異巨大[2]。制訂指南的指南是規范臨床指南制訂方法,保障指南方法學質量和推薦意見正確性的重要手段。遺憾的是,我國作為人口與衛生大國,尚未發布符合中國國情、滿足臨床需求,又兼顧國際共識的標準、方法和證據的臨床指南制訂方法與規范。本文旨在比較全球制訂臨床指南的指南的方法學異同等,為我國相關指南的制訂提供方法學參考,同時為制訂我國臨床指南的指南提供方法學依據與借鑒。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
①研究內容:臨床指南制訂的方法,包括原則、標準、流程等;②研究類型:指南;③制訂機構:國際級或國家級的指南制訂機構、專業學術組織;④版本:最新版。
1.1.2 排除標準
①非中、英文文獻;②無法獲取全文者;③某一部臨床指南的制訂方法;④某家醫院臨床指南的制訂標準、方法和流程;⑤指南制訂中某一步驟的標準、方法和流程。
1.2 檢索策略
計算機檢索6個生物醫學文獻數據庫,包括MEDLINE、EMbase、The Cochrane Library、CNKI、VIP和CBM;6個指南數據庫及18個學術機構與衛生行政部門網站,查找制訂臨床指南的指南(表 1)。數據庫采用題名或關鍵詞進行檢索,檢索詞為:guideline* AND (handbook OR develope* OR process),指南AND(手冊OR方法OR流程OR制定OR制訂),并根據數據庫、網站適當調整檢索詞。再通過閱讀已納入指南的參考文獻,以補充獲取相關指南。

1.3 資料提取
利用Excel軟件提取以下信息:①指南名稱;②發表時間;③制訂機構;④機構所屬國家;⑤指南類型(制訂全科或某一專科臨床指南的指南);⑥指南篇章結構;⑦制訂指南的指南的原則、方法與流程。
1.4 統計分析
采用描述性分析方法,分析全球制訂臨床指南的指南的基本情況,比較不同指南間指南結構,指南制訂原則、方法與流程等的異同。
2 結果
2.1 文獻檢索結果
按照檢索策略,初檢獲文獻5 619篇。按納入排除標準篩選文獻,最終納入符合納入標準的制訂臨床指南的指南25篇[3-27](圖 1)。

2.2 指南基本特征
納入的25篇指南,發表于1998~2016年;主要來自北美洲(50%),其次是歐洲(20.8%);11篇(45.8%)為指導全科臨床指南制訂的指南,其余為指導專科臨床指南制訂的指南(54.2%)(表 2)。

2.3 指南組成結構
各指南組成結構基本一致,包括:目錄、概述、指南制訂方法與流程、附錄、詞匯表及參考文獻(表 3)。

2.4 指南發表類型
制訂指南的指南共建議了6種指南類型,其中以NICE和SIGN指南類型最多。此外,NICE還對其收錄的指南進行整合加工形成NICE版指南(表 4)。

2.5 指南制訂方法與流程
25部制訂指南的指南提及的方法與流程,包括:①確定指南范圍;②選擇指南主題;③成立指南小組/委員會;④管理利益沖突/利益聲明;⑤制訂時間表/軸;⑥構建問題;⑦系統檢索文獻;⑧評價研究證據;⑨評價經濟性;⑩關聯相關指南;?考慮倫理問題;?形成推薦意見;?評審指南草案;?試用指南;?完成與發表指南;?實施指南;?審查與更新指南(表 5)。各指南推薦的流程從6至16步不等。其中,NICE、SIGN和WHO的指南內容最詳細,值得借鑒參考。各步驟中,“成立指南小組”、“系統檢索文獻”、“評價研究證據”和“形成推薦意見”被提及最多,是制訂指南的關鍵流程。

2.6 關鍵流程的方法學比較
2.6.1 成立指南制訂小組
組建有效的指南制訂小組是制訂指南的重要流程[4]。指南制訂小組負責指南選題、問題構建、證據評價與推薦意見形成等工作。為使該組織高效運轉,通常建議其規模在12~20人之間(表 6)。全科指南人數要求高于專科指南。不同指南所推薦的小組組織形式稍有差別,但均要求由多學科人員構成,包括:相關衛生領域專業人員、方法學人員(信息專家、系統評價專家、衛生經濟學家等)、患者或監護人代表、志愿者組織代表等。NICE指南還提出[4]:當指南制訂小組成員知識不足以形成推薦意見時,可請專家顧問;另可聘請一名組外觀察員,必要時參與指南制訂相關討論。

2.6.2 系統檢索文獻
系統評價即以科學、規范的方法系統檢索并嚴格評價總結干預措施有效性、安全性等相關證據,評價研究結果的普遍性和一致性,或發現數據的不一致性[27]。文獻檢索是系統評價的關鍵步驟之一。各指南對文獻檢索方法學步驟推薦基本一致:即首先明確和構建具體的檢索問題、選擇數據庫、制訂檢索策略并檢索相關文獻。問題構建的方法各指南間有差異,以PICO法最常用,共有9部指南推薦。其余方法盡管名稱與要素不同,但其內容實質與PICO近似(表 7)。對數據庫的選擇,NICE指南最詳盡。其介紹的各類研究可檢索的數據庫值得參考。

指南中提及的系統檢索文獻時應注意的問題:①制作系統評價前首先需評估是否需一篇新的系統評價。若當前已有高質量系統評價,則可直接使用其結果,以此為基礎更新系統評價。這樣比制訂新系統評價時間和人力、物力成本更低[6]。②同一指南多個系統評價的問題應分組歸納,若有重疊的問題可放在一個系統評價中完成[4]。③ SIGN特別強調,在文獻檢索階段需從患者角度考慮問題構建,收集相關資料,并建議必要時對此做一篇系統評價[5]。
2.6.3 評價證據質量
指南對證據評價及推薦意見分級的工具推薦不一,推薦最多的方法是GRADE(表 8)。GATE與QUADAS可針對診斷性研究,其余方法針對干預性研究。

2.6.4 形成推薦意見
推薦形成的步驟在指南間基本一致包括:① “評估決定推薦意見的相關因素”;② “就推薦意見達成一致”和③ “撰寫推薦意見”。其中,決定推薦意見的相關因素包括:證據質量、利弊平衡結果、患者價值觀和意愿及干預措施對資源的消耗情況。多數指南均推薦采用決策綜合評定上述因素。推薦意見的撰寫必須明確且具有可操作性,可采用PICO格式,且指南中所有推薦意見的語言表述應保持一致。
在推薦意見強度的表達上各指南存在差異,分為兩類:一類以分級方式體現推薦強度,如GRADE以“強推薦”、“弱推薦”表示推薦強度;另一類,用推薦意見中的推薦強度措辭表達,如:NICE建議在推薦意見中采用“必須”、“應該”和“可以”表達三種不同強度的推薦[4]。
在形成推薦意見時,指南提出需注意的幾點問題:①不建議提出推薦意見的情況:當一項干預有效性證據不足時,最好不要提出推薦意見[6]。應推薦可開展的研究,并在適當情況下對其優先性排序。②不建議在指南中推薦用藥劑量,除非某藥在臨床上經常用錯劑量,或有明確證據顯示不同劑量效果存在差異。一般情況下建議讀者在藥品詳細信息中查詢用藥劑量[4]。③若推薦意見為超說明說用藥,可采用批注方式說明,并建議標注用藥劑量[4]。
3 討論
3.1 本研究與同類研究的比較
2006年,WHO意識到規范指南制訂方法對保障指南質量和作用的重要性,并啟動了研發制訂指南的指南項目。作為背景研究[28],WHO評估了已有制訂指南的指南,但因時間有限僅基于已有系統評價做出評估,未開展相關指南的系統評價,納入指南不全面。2007年,荷蘭皇家物理治療學會(The Royal Dutch Society for Physical Therapy,KNGF)為更新其制訂指南的指南于比較分析了不同的指南制訂方法,但亦未采用系統檢索納入指南而僅基于一項調查研究納入6部指南[29]。
另有3項系統評價評估了制訂指南的指南。2008年,Turner等[30]的系統評價納入6部由指南制訂機構發布的指南制訂指南,結果顯示不同指南推薦的制訂流程基本一致,但該研究同樣指出,指南的應用轉化與執行不佳,需分析原因何在。2012年,Ansari等[31]的系統評價納入了19部指南制訂指南,結果顯示NICE、SIGN和WHO指南制訂指南的質量較高。不同指南推薦的制訂流程基本一致,但指南質量和對相同步驟的推薦意見存在差異。多數指南缺乏“將倫理問題考慮到指南制訂中的方法”和“指南預試”的相應方法。2014年,一項系統評價針對指南更新的方法與流程,評價了現有制訂指南的指南中的方法,結果顯示大部分制訂指南的指南缺乏相關內容,尚需加強指南更新方法的研究[32]。
3.2 制訂臨床實踐指南的指南的異同
指南的數量與質量方面:北美洲制訂指南數量占總指南數的一半,英國與蘇格蘭制訂的指南數量不多但質量高。上述國家和地區是目前該領域方法學發展的前沿地區,所發布的指南是指南制訂的重要參考。盡管與發達國家相比,發展中國家該領域的指南數量和質量均滯后,但部分發展中國家(如愛沙尼亞)已意識到指南制訂方法對規范臨床指南的重要性,并發布了本國制訂指南的指南。
指南篇章結構及制訂流程方面:無論全科、專科指南或不同國家的制訂指南的指南,篇章結構與關鍵流程均基本一致。僅在具體流程方法的闡述及部分流程的推薦上存在差異。如流程更詳細的指南中提及了:如何確定指南范圍與主題,如何利用其他相關指南,考慮相關倫理問題及規劃指南制訂的時間計劃等。更詳盡的流程更有利于指南制訂者在規劃和制訂指南時盡量全面的考慮和規范實施。相同流程中所推薦使用的方法和介紹的詳略程度不同。
3.3 制訂臨床實踐指南的指南的問題與局限
盡管已有相關指南指導臨床實踐指南的制訂,但其推廣與實施效果并不理想,這是現有制訂臨床實踐指南的指南存在的共同問題[30]。WHO指南制訂手冊是影響范圍最廣的指南制訂手冊之一,但評估其績效顯示[33]:WHO在制訂指南時,并未很好的應用指南制訂手冊中推薦的方法與流程,主要原因為:缺乏資源、技術能力有限,更重要的是對WHO制訂指南的指南理解不足。兒科領域也存在同樣問題:盡管美國兒科學會(AAP)積極參與各項指南制訂方法的研究,并于2004年聯合相關學會發布了關于推薦意見分級的申明,于2008年制訂發布了關于增加指南透明度的申明,但2013年一項對AAP制訂指南的質量評價結果顯示:僅1部AAP制訂的指南同時遵循了2004年和2008年的指南制訂標準[24]。
3.4 本研究的局限性
研究僅納入了以英文或中文發表的指南,可能遺漏以其他語言發表的相關指南。
3.5 結論
現有制訂指南的指南所推薦的流程基本一致,但各步驟的方法學及敘述的詳略程度存在差異。可借鑒當前較為完善的制訂指南的指南,遵照國際通行的指南制訂方法,同時結合我國國情,研發具有自主知識產權、操作性更強的制訂指南的指南,以滿足我國臨床指南制訂的方法學需求。
臨床指南即通過系統方法學制訂出的指導意見,用以輔助臨床實踐者和患者做出最適宜的衛生保健決策[1]。通過制訂和推廣適用且方便使用的臨床指南,可影響公共衛生決策,普及合理的衛生干預措施,從而不僅提升醫療服務質量,也可促進不同經濟發展水平地區間衛生服務內容和質量的一致性,提高衛生服務效率,保障衛生服務公平性。臨床指南能否正確發揮作用,高度取決于指南制訂的方法與質量。研究顯示:缺乏指南制訂標準可導致相同疾病指南間推薦意見差異巨大[2]。制訂指南的指南是規范臨床指南制訂方法,保障指南方法學質量和推薦意見正確性的重要手段。遺憾的是,我國作為人口與衛生大國,尚未發布符合中國國情、滿足臨床需求,又兼顧國際共識的標準、方法和證據的臨床指南制訂方法與規范。本文旨在比較全球制訂臨床指南的指南的方法學異同等,為我國相關指南的制訂提供方法學參考,同時為制訂我國臨床指南的指南提供方法學依據與借鑒。
1 資料與方法
1.1 納入與排除標準
1.1.1 納入標準
①研究內容:臨床指南制訂的方法,包括原則、標準、流程等;②研究類型:指南;③制訂機構:國際級或國家級的指南制訂機構、專業學術組織;④版本:最新版。
1.1.2 排除標準
①非中、英文文獻;②無法獲取全文者;③某一部臨床指南的制訂方法;④某家醫院臨床指南的制訂標準、方法和流程;⑤指南制訂中某一步驟的標準、方法和流程。
1.2 檢索策略
計算機檢索6個生物醫學文獻數據庫,包括MEDLINE、EMbase、The Cochrane Library、CNKI、VIP和CBM;6個指南數據庫及18個學術機構與衛生行政部門網站,查找制訂臨床指南的指南(表 1)。數據庫采用題名或關鍵詞進行檢索,檢索詞為:guideline* AND (handbook OR develope* OR process),指南AND(手冊OR方法OR流程OR制定OR制訂),并根據數據庫、網站適當調整檢索詞。再通過閱讀已納入指南的參考文獻,以補充獲取相關指南。

1.3 資料提取
利用Excel軟件提取以下信息:①指南名稱;②發表時間;③制訂機構;④機構所屬國家;⑤指南類型(制訂全科或某一專科臨床指南的指南);⑥指南篇章結構;⑦制訂指南的指南的原則、方法與流程。
1.4 統計分析
采用描述性分析方法,分析全球制訂臨床指南的指南的基本情況,比較不同指南間指南結構,指南制訂原則、方法與流程等的異同。
2 結果
2.1 文獻檢索結果
按照檢索策略,初檢獲文獻5 619篇。按納入排除標準篩選文獻,最終納入符合納入標準的制訂臨床指南的指南25篇[3-27](圖 1)。

2.2 指南基本特征
納入的25篇指南,發表于1998~2016年;主要來自北美洲(50%),其次是歐洲(20.8%);11篇(45.8%)為指導全科臨床指南制訂的指南,其余為指導專科臨床指南制訂的指南(54.2%)(表 2)。

2.3 指南組成結構
各指南組成結構基本一致,包括:目錄、概述、指南制訂方法與流程、附錄、詞匯表及參考文獻(表 3)。

2.4 指南發表類型
制訂指南的指南共建議了6種指南類型,其中以NICE和SIGN指南類型最多。此外,NICE還對其收錄的指南進行整合加工形成NICE版指南(表 4)。

2.5 指南制訂方法與流程
25部制訂指南的指南提及的方法與流程,包括:①確定指南范圍;②選擇指南主題;③成立指南小組/委員會;④管理利益沖突/利益聲明;⑤制訂時間表/軸;⑥構建問題;⑦系統檢索文獻;⑧評價研究證據;⑨評價經濟性;⑩關聯相關指南;?考慮倫理問題;?形成推薦意見;?評審指南草案;?試用指南;?完成與發表指南;?實施指南;?審查與更新指南(表 5)。各指南推薦的流程從6至16步不等。其中,NICE、SIGN和WHO的指南內容最詳細,值得借鑒參考。各步驟中,“成立指南小組”、“系統檢索文獻”、“評價研究證據”和“形成推薦意見”被提及最多,是制訂指南的關鍵流程。

2.6 關鍵流程的方法學比較
2.6.1 成立指南制訂小組
組建有效的指南制訂小組是制訂指南的重要流程[4]。指南制訂小組負責指南選題、問題構建、證據評價與推薦意見形成等工作。為使該組織高效運轉,通常建議其規模在12~20人之間(表 6)。全科指南人數要求高于專科指南。不同指南所推薦的小組組織形式稍有差別,但均要求由多學科人員構成,包括:相關衛生領域專業人員、方法學人員(信息專家、系統評價專家、衛生經濟學家等)、患者或監護人代表、志愿者組織代表等。NICE指南還提出[4]:當指南制訂小組成員知識不足以形成推薦意見時,可請專家顧問;另可聘請一名組外觀察員,必要時參與指南制訂相關討論。

2.6.2 系統檢索文獻
系統評價即以科學、規范的方法系統檢索并嚴格評價總結干預措施有效性、安全性等相關證據,評價研究結果的普遍性和一致性,或發現數據的不一致性[27]。文獻檢索是系統評價的關鍵步驟之一。各指南對文獻檢索方法學步驟推薦基本一致:即首先明確和構建具體的檢索問題、選擇數據庫、制訂檢索策略并檢索相關文獻。問題構建的方法各指南間有差異,以PICO法最常用,共有9部指南推薦。其余方法盡管名稱與要素不同,但其內容實質與PICO近似(表 7)。對數據庫的選擇,NICE指南最詳盡。其介紹的各類研究可檢索的數據庫值得參考。

指南中提及的系統檢索文獻時應注意的問題:①制作系統評價前首先需評估是否需一篇新的系統評價。若當前已有高質量系統評價,則可直接使用其結果,以此為基礎更新系統評價。這樣比制訂新系統評價時間和人力、物力成本更低[6]。②同一指南多個系統評價的問題應分組歸納,若有重疊的問題可放在一個系統評價中完成[4]。③ SIGN特別強調,在文獻檢索階段需從患者角度考慮問題構建,收集相關資料,并建議必要時對此做一篇系統評價[5]。
2.6.3 評價證據質量
指南對證據評價及推薦意見分級的工具推薦不一,推薦最多的方法是GRADE(表 8)。GATE與QUADAS可針對診斷性研究,其余方法針對干預性研究。

2.6.4 形成推薦意見
推薦形成的步驟在指南間基本一致包括:① “評估決定推薦意見的相關因素”;② “就推薦意見達成一致”和③ “撰寫推薦意見”。其中,決定推薦意見的相關因素包括:證據質量、利弊平衡結果、患者價值觀和意愿及干預措施對資源的消耗情況。多數指南均推薦采用決策綜合評定上述因素。推薦意見的撰寫必須明確且具有可操作性,可采用PICO格式,且指南中所有推薦意見的語言表述應保持一致。
在推薦意見強度的表達上各指南存在差異,分為兩類:一類以分級方式體現推薦強度,如GRADE以“強推薦”、“弱推薦”表示推薦強度;另一類,用推薦意見中的推薦強度措辭表達,如:NICE建議在推薦意見中采用“必須”、“應該”和“可以”表達三種不同強度的推薦[4]。
在形成推薦意見時,指南提出需注意的幾點問題:①不建議提出推薦意見的情況:當一項干預有效性證據不足時,最好不要提出推薦意見[6]。應推薦可開展的研究,并在適當情況下對其優先性排序。②不建議在指南中推薦用藥劑量,除非某藥在臨床上經常用錯劑量,或有明確證據顯示不同劑量效果存在差異。一般情況下建議讀者在藥品詳細信息中查詢用藥劑量[4]。③若推薦意見為超說明說用藥,可采用批注方式說明,并建議標注用藥劑量[4]。
3 討論
3.1 本研究與同類研究的比較
2006年,WHO意識到規范指南制訂方法對保障指南質量和作用的重要性,并啟動了研發制訂指南的指南項目。作為背景研究[28],WHO評估了已有制訂指南的指南,但因時間有限僅基于已有系統評價做出評估,未開展相關指南的系統評價,納入指南不全面。2007年,荷蘭皇家物理治療學會(The Royal Dutch Society for Physical Therapy,KNGF)為更新其制訂指南的指南于比較分析了不同的指南制訂方法,但亦未采用系統檢索納入指南而僅基于一項調查研究納入6部指南[29]。
另有3項系統評價評估了制訂指南的指南。2008年,Turner等[30]的系統評價納入6部由指南制訂機構發布的指南制訂指南,結果顯示不同指南推薦的制訂流程基本一致,但該研究同樣指出,指南的應用轉化與執行不佳,需分析原因何在。2012年,Ansari等[31]的系統評價納入了19部指南制訂指南,結果顯示NICE、SIGN和WHO指南制訂指南的質量較高。不同指南推薦的制訂流程基本一致,但指南質量和對相同步驟的推薦意見存在差異。多數指南缺乏“將倫理問題考慮到指南制訂中的方法”和“指南預試”的相應方法。2014年,一項系統評價針對指南更新的方法與流程,評價了現有制訂指南的指南中的方法,結果顯示大部分制訂指南的指南缺乏相關內容,尚需加強指南更新方法的研究[32]。
3.2 制訂臨床實踐指南的指南的異同
指南的數量與質量方面:北美洲制訂指南數量占總指南數的一半,英國與蘇格蘭制訂的指南數量不多但質量高。上述國家和地區是目前該領域方法學發展的前沿地區,所發布的指南是指南制訂的重要參考。盡管與發達國家相比,發展中國家該領域的指南數量和質量均滯后,但部分發展中國家(如愛沙尼亞)已意識到指南制訂方法對規范臨床指南的重要性,并發布了本國制訂指南的指南。
指南篇章結構及制訂流程方面:無論全科、專科指南或不同國家的制訂指南的指南,篇章結構與關鍵流程均基本一致。僅在具體流程方法的闡述及部分流程的推薦上存在差異。如流程更詳細的指南中提及了:如何確定指南范圍與主題,如何利用其他相關指南,考慮相關倫理問題及規劃指南制訂的時間計劃等。更詳盡的流程更有利于指南制訂者在規劃和制訂指南時盡量全面的考慮和規范實施。相同流程中所推薦使用的方法和介紹的詳略程度不同。
3.3 制訂臨床實踐指南的指南的問題與局限
盡管已有相關指南指導臨床實踐指南的制訂,但其推廣與實施效果并不理想,這是現有制訂臨床實踐指南的指南存在的共同問題[30]。WHO指南制訂手冊是影響范圍最廣的指南制訂手冊之一,但評估其績效顯示[33]:WHO在制訂指南時,并未很好的應用指南制訂手冊中推薦的方法與流程,主要原因為:缺乏資源、技術能力有限,更重要的是對WHO制訂指南的指南理解不足。兒科領域也存在同樣問題:盡管美國兒科學會(AAP)積極參與各項指南制訂方法的研究,并于2004年聯合相關學會發布了關于推薦意見分級的申明,于2008年制訂發布了關于增加指南透明度的申明,但2013年一項對AAP制訂指南的質量評價結果顯示:僅1部AAP制訂的指南同時遵循了2004年和2008年的指南制訂標準[24]。
3.4 本研究的局限性
研究僅納入了以英文或中文發表的指南,可能遺漏以其他語言發表的相關指南。
3.5 結論
現有制訂指南的指南所推薦的流程基本一致,但各步驟的方法學及敘述的詳略程度存在差異。可借鑒當前較為完善的制訂指南的指南,遵照國際通行的指南制訂方法,同時結合我國國情,研發具有自主知識產權、操作性更強的制訂指南的指南,以滿足我國臨床指南制訂的方法學需求。