GRADE 工作組針對網狀 Meta 分析(NMA)制訂了 GRADE 證據總結(SoF)表,目的是規范 NMA 結果的證據分級過程和結果展示。本文對 NMA-SoF 表的主要內容進行詳細介紹,并舉例說明 SoF 表的使用方法和注意事項。
引用本文: 王巍巍, 楊智榮, 孫鳳, 詹思延. 網狀 Meta 分析 GRADE 證據總結表的制訂、解讀與應用. 中國循證醫學雜志, 2020, 20(12): 1471-1476. doi: 10.7507/1672-2531.202008163 復制
面對一個具體的臨床問題,臨床醫生或決策者通常需要從眾多的干預措施中選擇對患者最安全有效的措施。傳統 Meta 分析(meta-analysis,MA)基于直接比較方法展開研究,如果缺少直接比較的研究證據或者直接比較研究的質量低,則需要間接比較方法獲取證據進行補充,因此網狀 Meta 分析(network-meta-analysis,NMA)應運而生,其可實現對同一證據體的所有干預措施進行相互比較和綜合排序。
臨床醫生或決策者在使用證據時,根據不同用途對研究結果的呈現形式有不同的需求。證據推薦分級的評估、制訂與評價(The Grading of Recommendations,Assessment,Development,and Evaluation,GRADE)系統的證據總結(Summary of Findings,SoF)表可直觀、簡潔地呈現傳統系統評價的主要結果[1-3],例如重要結局的證據確定性和療效大小等關鍵信息[1, 2, 4-6]。SoF 在傳統系統評價中的實用性已經得到了證明,其對總結證據非常有幫助。NMA 綜合了直接比較和間接比較證據,產生的研究結果更多。關于如何報告 NMA 結果更有助于決策者和臨床醫生高效作出決策,雖然已有學者[7-10]進行探討,但未達成統一共識,最佳呈現方式難以確定[11],為解決此問題,GRADE 工作組于 2012 年啟動 GRADE NMA-SoF 表格制訂工作,歷經 7 年并于 2019 年正式發布。
1 制訂過程
采用質性研究的方法和基本原則進行資料收集和調查分析,全面總結使用者對 NMA-SoF 表的看法和改進計劃。NMA-SoF 表的制訂分為 3 個階段:① 成立專家指導小組,在 2012 年 GRADE 工作組會議上提議 NMA-SoF 表格初稿,并根據工作組成員的反饋進行修訂;② 2013 年到 2016 年間,工作組與 42 名 MA 和 NMA 方面經驗豐富的衛生保健研究人員召開 4 次頭腦風暴會議,根據與會者提出的改進意見對 NMA-SoF 表格進行修訂;③ 使用者測試(或可用性測試)階段,從使用者角度出發,了解其意見并據此進行更新[12, 13],主要焦點是探討 NMA-SoF 的格式是否滿足使用者的需求,提高用戶對報告信息的理解。使用者測試目標人群分為 3 類:系統評價作者、方法學家、臨床醫生或衛生保健相關專業人員[13]。采用質性研究中常用的目的性抽樣方法選擇訪談研究對象[13],抽樣策略采用效標抽樣[14, 15],即為抽樣設定一個標準或條件,然后選擇所有符合標準的個案進行研究,確保最終的研究對象能夠代表 NMA-SoF 表用戶(MA 或 NMA 的使用者)。
經過 4 輪頭腦風暴和使用者測試,研究者們對 SoF 涵蓋內容和呈現形式(單個結局或多個結局)進行了全面考量和取舍,內容涉及到 PICO、網狀關系圖、研究數量、研究對象數量、干預措施數量及表現形式、效應估計值(直接效應估計及其可信區間、間接效應估計及其可信區間、相對效應值、絕對效應值)、證據質量、累積排名曲線下面積(surface under the cumulative ranking curve,SURCA)及其可信區間、基線風險納入等 NMA 報告結果,最終確定了適用于二分類變量的 NMA-SoF 表(表 1)。由于工作組尚未對連續性變量的 NMA-SoF 進行測試,因此本文只介紹二分類變量的 NMA-SoF 表。NMA-SoF 表格的開發過程和最終的格式版本見 Yepes-Nu?ez 等[16]在 Journal of Clinical Epidemiology 上發表的文章。

2 GRADE NMA-SoF 解讀
最終的 NMA-SoF 表格由三部分構成。
2.1 第一部分
位于表格上部,顯示研究問題拆解為 PICO 組分的詳細信息,其中,P 代表研究對象(patient/population),I 代表干預措施(intervention),C 代表對照組或參照組(comparator/reference),O 代表結局指標(outcome),通常還需提供研究地點(setting)。每個 NMA-SoF 表格展示一個結局的關鍵研究信息,一項干預措施作為“參照組”,其他干預措施列在“干預措施”標簽下。這部分的研究信息可以從 NMA 的結構化摘要部分和研究方法部分獲得。另外,NMA 的網狀關系圖在第一部分的右側展示,建議用不同顏色表示不同干預措施,避免使用紅色和綠色等常見色覺障礙顏色。網狀關系圖可以從 NMA 的結果部分獲得。
2.2 第二部分
位于表格中部,報告信息由 6 列構成。
第 1 列是詳細描述針對特定結局的干預措施直接比較的研究數量和研究對象數量。每一種干預措施在網狀關系圖中用哪一種顏色展示,需要在第 1 列用相應顏色圓點示意。研究數量和樣本量信息可以從納入研究特征表格中獲得。
第 2 列填寫干預措施基于參照組計算的的相對效應估計,并標識相對效應的貢獻是來自直接證據、間接證據還是網狀估計,建議展示三種估計中確定性最高的效應估計值。推薦使用 CINeMA 平臺(https://cinema.ispm.unibe.ch/),該平臺交互性強,可以指定任一干預措施作為參照組,高效計算來自直接估計、間接估計以及混合估計的相對效應估計值及其可信區間。
第 3 列分別填寫參照組和干預組的絕對效應信息和兩組風險差異的絕對效應信息及 95% 可信區間。
第 4 列填寫證據質量以及證據群降級因素。證據質量通常采用 GRADE 證據分級體系來進行評級,以評價不同干預措施對重要結局產生影響的可信程度。對于干預效果估計,隨機對照試驗被認為是高質量證據,觀察性研究是低質量證據,但有 5 種因素可導致證據質量下降,3 種因素可以提升證據質量。降級因素包括納入研究的偏倚風險(risk of bias)[11],研究人群、干預措施和結局指標的間接性(indirectness)[17],不同研究合并結果的不精確性(imprecision)[18],不同研究間結果的不一致性(inconsistency)[19],發表偏倚(publication bias)[20]。由于 NMA 同時納入直接比較和間接比較的證據,除上述 5 個降級因素外,還需考慮 2 個降級因素:間接比較不同組別在研究人群基線特征、共同對照以及結局測量方面的不可傳遞性(intransitivity)和直接比較與間接比較結果的不同質性(incoherence)[21]。研究的偏倚風險指的是研究設計或實施過程中的缺陷,可能導致估計結果系統性偏離真實值,建議使用 Cochrane 偏倚風險評估工具[22]進行評價。間接性在成對 MA 中指的是納入研究與研究問題的相關性,研究人群干預措施、結局和地點可能無法代表系統評價作者要進行推斷的研究要素[17]。間接性在一定程度上提出了可傳遞性的問題,可傳遞性意味著通過治療措施 C 來估計治療措施 A 和治療措施 B 的相對效應時,在 A vs. C 和 B vs. C 的研究中的效應修飾因子分布是可比的。不精確性的評估需要定義具有臨床意義的閾值,治療效應可以是任意有益的效應,即使微小的差異,一旦超過閾值,可以認為一種治療優于另外一種,也可以將治療相對效應劃分為三類,分別是 X 更優、X 和 Y 沒有差異、Y 更優,中間的范圍又叫等效范圍,建議根據對患者有意義的絕對風險差異值確定等效范圍。不一致性指的是研究結果的變異性會影響對治療效應的點估計,而非隨機變異造成。在 NMA 中,不僅研究之間治療效果可能存在差異,直接或間接來源的證據之間也可能存在差異,后者也叫不同質性。發表偏倚指的是系統評價報告結果不能代表符合標準研究的結果而出現的偏倚,產生原因可能在于陰性結果的不易發表或延遲發表[23-25]。升級因素包括效應量大、劑量反應關系和混雜因素使效應降低。證據質量評級可劃分為高、中、低和極低四個等級。
GRADE 工作組建議針對 NMA 的證據等級評價可分為以下操作步驟[26, 27]:① 分別列出直接比較和間接比較的效應估計及可信區間。② 分別對每一組直接比較和間接比較的證據質量進行分級。對于間接比較的證據質量分級首先要遴選最佳比較路徑,公共對照數量越多,結果可信度越差。選定路徑后,對路徑中的單組分別進行證據質量評級,以其中證據水平低的等級為準。另外,需考慮不同組別間人群特征、公共對照以及結局測量是否存在明顯差異,不可傳遞性也會降低間接比較的可信程度。③ 確定和呈現 NMA 基于直接比較和間接比較的證據質量,對于網狀估計,直接比較和間接比較證據共存的情況,以證據級別較高的證據等級為準。④ 直接比較和間接比較的結果是否存在不一致性,判斷方法有不同質性模型、回測法等[28-33],若存在嚴重不一致性,則需要再降低一級。
第 5 列填寫排序信息,考慮到排序有較大程度的不精確性[34],建議采用中位數排序或 SUCRA 及其可信區間,如果區間過寬且存在重疊線性,則提示排名的準確性需要慎重對待。貝葉斯方法可估計平均排序和 SUCRA 值的 95% 可信區間,進而計算得到中位數排序及四分位數區間。
第 6 列填寫結果概述,基于效應估計、證據質量和排名或 SURCA 等綜合信息,描述每項干預相對于參照組的優劣程度,分為 4 類:確定優效(definitely superior)、可能優效(probably superior)、可能劣效(probably inferior)、確定劣效(definitely inferior)。
2.3 第三部分
位于下部,由 3 個單元構成,分別是:① 關于 NMA 術語和縮寫的定義;② 每一種最終 GRADE 證據確定性判斷的描述;③ 關于詳細描述證據評估確定性理由的解釋性腳注。
3 案例展示與解讀、總結(實例分析)
以 2019 年 10 月 10 日發表在 BMJ 上的 NMA 舉例說明 NMA-SoF 的應用,填寫說明見表 2,單個結局和多結局的 NMA-SoF 示例見 https://www.jianguoyun.com/p/DUJvRqMQn5TsBhizocAD。該研究目的在于評價不同口服抗血栓藥物對冠狀動脈旁路移植術后大隱靜脈移植失敗的預防效果[35],安全性主要結局指標為大出血。該研究除正式發表的方案和試驗結果文章外,還附有補充結果作為附件,并在 PROSPERO 網站進行了注冊(CRD42017065678)。雖然實例發表在 NMA-SoF 表格公開發表之前,但文中對主要結局指標的研究結果進行了匯總,提供了 NMA-SoF 表格所需的絕大部分要素,包括參照組、研究數量、研究對象數量、相對效應值(標注了是否來源于間接估計)、絕對效應值和差值、證據的確定性和 SUCRA。文中還提供了 2 個網狀關系圖,分別針對有效性主要結局指標和安全性主要結局指標。然而,這篇 NMA 在結果報告方面存在的問題包括:① 網狀關系圖中的干預措施未用不同顏色進行區分;② 未提供中位數排序或排序的可信區間;③ 未提供結果概述。

4 展望
4.1 NMA-SoF 表格的優缺點
NMA-SoF 的優點:① 在網狀關系圖中采用不同顏色表示不同干預措施,標識醒目,方便識別圖表中的干預措施,并且考慮色覺障礙用戶的需求,規避使用紅色和綠色;② 僅呈現直接估計或間接估計中確定性最高的效應估計,列出對應的相對效應估計和絕對效應估計值,標明估計是來自直接證據還是間接證據;③ 提供 GRADE 證據評估的確定性;④ 考慮到排序的誤導性,建議提供中位數排序或者可信區間。
NMA-SoF 的局限性在于:① 參照組的選擇對于表格呈現的信息至關重要,取決于不同決策場景需求,可以考慮安慰劑、金標準治療手段、成本-效益最高的干預措施、成本-效益最差的干預措施等方面。② 每個結局指標需要 1 個 NMA-SoF 表格呈現所有干預措施的研究結果,如果關注的結局指標較多,則需要多個表格才能呈現完整的結果。另一種備選格式,單個 NMA-SoF 表格對有效性和安全性的結局顯示相同的前三名干預措施。對于系統評價作者而言,在報告結果的時候需要作出選擇,而無論選擇哪種,對于證據的使用者和決策者可能都不是全面的。
4.2 應用現狀
NMA-SoF 于 2019 年 11 月發表后迅速成為“高被引論文”,Web of Science 上被引頻次已有 10 次,被 9 個 NMA(6 個 Cochrane 系統評價)和 1 個研究方案引用,根據對應領域和出版年中的高引用閾值,被引次數可以歸入其學術領域中最優秀的 1%。目前 Cochrane 協作組已推薦使用 NMA-SoF 表格,但其他雜志、網站、機構的推薦使用稍顯滯后。
4.3 應用前景
NMA-SoF 的目標使用人群包括系統評價作者、指南制訂者、衛生保健專業人員。對于 NMA 作者而言,NMA-SoF 的推廣和應用不僅可提高 NMA 結果報告的規范性,也在一定程度上幫助研究者開展科學規范的研究設計,提升研究質量。對于指南制訂者而言,NMA-SoF 不僅提供證據質量分級的信息,也提供了絕對效應值,方便指南制訂者參考臨床決策閾值進行判斷是否給出推薦。對于衛生保健專業人員而言,NMA-SoF 可以高效地展示 NMA 的研究結果,提高證據的實用性,幫助其做出更加明智的決策。
目前,GRADE 工作組正計劃制訂正式的 NMA-SoF 使用手冊,根據用戶經驗的積累進一步完善 NMA-SoF 以及開發交互式的 SoF 表格,方便納入證據決策框架。
面對一個具體的臨床問題,臨床醫生或決策者通常需要從眾多的干預措施中選擇對患者最安全有效的措施。傳統 Meta 分析(meta-analysis,MA)基于直接比較方法展開研究,如果缺少直接比較的研究證據或者直接比較研究的質量低,則需要間接比較方法獲取證據進行補充,因此網狀 Meta 分析(network-meta-analysis,NMA)應運而生,其可實現對同一證據體的所有干預措施進行相互比較和綜合排序。
臨床醫生或決策者在使用證據時,根據不同用途對研究結果的呈現形式有不同的需求。證據推薦分級的評估、制訂與評價(The Grading of Recommendations,Assessment,Development,and Evaluation,GRADE)系統的證據總結(Summary of Findings,SoF)表可直觀、簡潔地呈現傳統系統評價的主要結果[1-3],例如重要結局的證據確定性和療效大小等關鍵信息[1, 2, 4-6]。SoF 在傳統系統評價中的實用性已經得到了證明,其對總結證據非常有幫助。NMA 綜合了直接比較和間接比較證據,產生的研究結果更多。關于如何報告 NMA 結果更有助于決策者和臨床醫生高效作出決策,雖然已有學者[7-10]進行探討,但未達成統一共識,最佳呈現方式難以確定[11],為解決此問題,GRADE 工作組于 2012 年啟動 GRADE NMA-SoF 表格制訂工作,歷經 7 年并于 2019 年正式發布。
1 制訂過程
采用質性研究的方法和基本原則進行資料收集和調查分析,全面總結使用者對 NMA-SoF 表的看法和改進計劃。NMA-SoF 表的制訂分為 3 個階段:① 成立專家指導小組,在 2012 年 GRADE 工作組會議上提議 NMA-SoF 表格初稿,并根據工作組成員的反饋進行修訂;② 2013 年到 2016 年間,工作組與 42 名 MA 和 NMA 方面經驗豐富的衛生保健研究人員召開 4 次頭腦風暴會議,根據與會者提出的改進意見對 NMA-SoF 表格進行修訂;③ 使用者測試(或可用性測試)階段,從使用者角度出發,了解其意見并據此進行更新[12, 13],主要焦點是探討 NMA-SoF 的格式是否滿足使用者的需求,提高用戶對報告信息的理解。使用者測試目標人群分為 3 類:系統評價作者、方法學家、臨床醫生或衛生保健相關專業人員[13]。采用質性研究中常用的目的性抽樣方法選擇訪談研究對象[13],抽樣策略采用效標抽樣[14, 15],即為抽樣設定一個標準或條件,然后選擇所有符合標準的個案進行研究,確保最終的研究對象能夠代表 NMA-SoF 表用戶(MA 或 NMA 的使用者)。
經過 4 輪頭腦風暴和使用者測試,研究者們對 SoF 涵蓋內容和呈現形式(單個結局或多個結局)進行了全面考量和取舍,內容涉及到 PICO、網狀關系圖、研究數量、研究對象數量、干預措施數量及表現形式、效應估計值(直接效應估計及其可信區間、間接效應估計及其可信區間、相對效應值、絕對效應值)、證據質量、累積排名曲線下面積(surface under the cumulative ranking curve,SURCA)及其可信區間、基線風險納入等 NMA 報告結果,最終確定了適用于二分類變量的 NMA-SoF 表(表 1)。由于工作組尚未對連續性變量的 NMA-SoF 進行測試,因此本文只介紹二分類變量的 NMA-SoF 表。NMA-SoF 表格的開發過程和最終的格式版本見 Yepes-Nu?ez 等[16]在 Journal of Clinical Epidemiology 上發表的文章。

2 GRADE NMA-SoF 解讀
最終的 NMA-SoF 表格由三部分構成。
2.1 第一部分
位于表格上部,顯示研究問題拆解為 PICO 組分的詳細信息,其中,P 代表研究對象(patient/population),I 代表干預措施(intervention),C 代表對照組或參照組(comparator/reference),O 代表結局指標(outcome),通常還需提供研究地點(setting)。每個 NMA-SoF 表格展示一個結局的關鍵研究信息,一項干預措施作為“參照組”,其他干預措施列在“干預措施”標簽下。這部分的研究信息可以從 NMA 的結構化摘要部分和研究方法部分獲得。另外,NMA 的網狀關系圖在第一部分的右側展示,建議用不同顏色表示不同干預措施,避免使用紅色和綠色等常見色覺障礙顏色。網狀關系圖可以從 NMA 的結果部分獲得。
2.2 第二部分
位于表格中部,報告信息由 6 列構成。
第 1 列是詳細描述針對特定結局的干預措施直接比較的研究數量和研究對象數量。每一種干預措施在網狀關系圖中用哪一種顏色展示,需要在第 1 列用相應顏色圓點示意。研究數量和樣本量信息可以從納入研究特征表格中獲得。
第 2 列填寫干預措施基于參照組計算的的相對效應估計,并標識相對效應的貢獻是來自直接證據、間接證據還是網狀估計,建議展示三種估計中確定性最高的效應估計值。推薦使用 CINeMA 平臺(https://cinema.ispm.unibe.ch/),該平臺交互性強,可以指定任一干預措施作為參照組,高效計算來自直接估計、間接估計以及混合估計的相對效應估計值及其可信區間。
第 3 列分別填寫參照組和干預組的絕對效應信息和兩組風險差異的絕對效應信息及 95% 可信區間。
第 4 列填寫證據質量以及證據群降級因素。證據質量通常采用 GRADE 證據分級體系來進行評級,以評價不同干預措施對重要結局產生影響的可信程度。對于干預效果估計,隨機對照試驗被認為是高質量證據,觀察性研究是低質量證據,但有 5 種因素可導致證據質量下降,3 種因素可以提升證據質量。降級因素包括納入研究的偏倚風險(risk of bias)[11],研究人群、干預措施和結局指標的間接性(indirectness)[17],不同研究合并結果的不精確性(imprecision)[18],不同研究間結果的不一致性(inconsistency)[19],發表偏倚(publication bias)[20]。由于 NMA 同時納入直接比較和間接比較的證據,除上述 5 個降級因素外,還需考慮 2 個降級因素:間接比較不同組別在研究人群基線特征、共同對照以及結局測量方面的不可傳遞性(intransitivity)和直接比較與間接比較結果的不同質性(incoherence)[21]。研究的偏倚風險指的是研究設計或實施過程中的缺陷,可能導致估計結果系統性偏離真實值,建議使用 Cochrane 偏倚風險評估工具[22]進行評價。間接性在成對 MA 中指的是納入研究與研究問題的相關性,研究人群干預措施、結局和地點可能無法代表系統評價作者要進行推斷的研究要素[17]。間接性在一定程度上提出了可傳遞性的問題,可傳遞性意味著通過治療措施 C 來估計治療措施 A 和治療措施 B 的相對效應時,在 A vs. C 和 B vs. C 的研究中的效應修飾因子分布是可比的。不精確性的評估需要定義具有臨床意義的閾值,治療效應可以是任意有益的效應,即使微小的差異,一旦超過閾值,可以認為一種治療優于另外一種,也可以將治療相對效應劃分為三類,分別是 X 更優、X 和 Y 沒有差異、Y 更優,中間的范圍又叫等效范圍,建議根據對患者有意義的絕對風險差異值確定等效范圍。不一致性指的是研究結果的變異性會影響對治療效應的點估計,而非隨機變異造成。在 NMA 中,不僅研究之間治療效果可能存在差異,直接或間接來源的證據之間也可能存在差異,后者也叫不同質性。發表偏倚指的是系統評價報告結果不能代表符合標準研究的結果而出現的偏倚,產生原因可能在于陰性結果的不易發表或延遲發表[23-25]。升級因素包括效應量大、劑量反應關系和混雜因素使效應降低。證據質量評級可劃分為高、中、低和極低四個等級。
GRADE 工作組建議針對 NMA 的證據等級評價可分為以下操作步驟[26, 27]:① 分別列出直接比較和間接比較的效應估計及可信區間。② 分別對每一組直接比較和間接比較的證據質量進行分級。對于間接比較的證據質量分級首先要遴選最佳比較路徑,公共對照數量越多,結果可信度越差。選定路徑后,對路徑中的單組分別進行證據質量評級,以其中證據水平低的等級為準。另外,需考慮不同組別間人群特征、公共對照以及結局測量是否存在明顯差異,不可傳遞性也會降低間接比較的可信程度。③ 確定和呈現 NMA 基于直接比較和間接比較的證據質量,對于網狀估計,直接比較和間接比較證據共存的情況,以證據級別較高的證據等級為準。④ 直接比較和間接比較的結果是否存在不一致性,判斷方法有不同質性模型、回測法等[28-33],若存在嚴重不一致性,則需要再降低一級。
第 5 列填寫排序信息,考慮到排序有較大程度的不精確性[34],建議采用中位數排序或 SUCRA 及其可信區間,如果區間過寬且存在重疊線性,則提示排名的準確性需要慎重對待。貝葉斯方法可估計平均排序和 SUCRA 值的 95% 可信區間,進而計算得到中位數排序及四分位數區間。
第 6 列填寫結果概述,基于效應估計、證據質量和排名或 SURCA 等綜合信息,描述每項干預相對于參照組的優劣程度,分為 4 類:確定優效(definitely superior)、可能優效(probably superior)、可能劣效(probably inferior)、確定劣效(definitely inferior)。
2.3 第三部分
位于下部,由 3 個單元構成,分別是:① 關于 NMA 術語和縮寫的定義;② 每一種最終 GRADE 證據確定性判斷的描述;③ 關于詳細描述證據評估確定性理由的解釋性腳注。
3 案例展示與解讀、總結(實例分析)
以 2019 年 10 月 10 日發表在 BMJ 上的 NMA 舉例說明 NMA-SoF 的應用,填寫說明見表 2,單個結局和多結局的 NMA-SoF 示例見 https://www.jianguoyun.com/p/DUJvRqMQn5TsBhizocAD。該研究目的在于評價不同口服抗血栓藥物對冠狀動脈旁路移植術后大隱靜脈移植失敗的預防效果[35],安全性主要結局指標為大出血。該研究除正式發表的方案和試驗結果文章外,還附有補充結果作為附件,并在 PROSPERO 網站進行了注冊(CRD42017065678)。雖然實例發表在 NMA-SoF 表格公開發表之前,但文中對主要結局指標的研究結果進行了匯總,提供了 NMA-SoF 表格所需的絕大部分要素,包括參照組、研究數量、研究對象數量、相對效應值(標注了是否來源于間接估計)、絕對效應值和差值、證據的確定性和 SUCRA。文中還提供了 2 個網狀關系圖,分別針對有效性主要結局指標和安全性主要結局指標。然而,這篇 NMA 在結果報告方面存在的問題包括:① 網狀關系圖中的干預措施未用不同顏色進行區分;② 未提供中位數排序或排序的可信區間;③ 未提供結果概述。

4 展望
4.1 NMA-SoF 表格的優缺點
NMA-SoF 的優點:① 在網狀關系圖中采用不同顏色表示不同干預措施,標識醒目,方便識別圖表中的干預措施,并且考慮色覺障礙用戶的需求,規避使用紅色和綠色;② 僅呈現直接估計或間接估計中確定性最高的效應估計,列出對應的相對效應估計和絕對效應估計值,標明估計是來自直接證據還是間接證據;③ 提供 GRADE 證據評估的確定性;④ 考慮到排序的誤導性,建議提供中位數排序或者可信區間。
NMA-SoF 的局限性在于:① 參照組的選擇對于表格呈現的信息至關重要,取決于不同決策場景需求,可以考慮安慰劑、金標準治療手段、成本-效益最高的干預措施、成本-效益最差的干預措施等方面。② 每個結局指標需要 1 個 NMA-SoF 表格呈現所有干預措施的研究結果,如果關注的結局指標較多,則需要多個表格才能呈現完整的結果。另一種備選格式,單個 NMA-SoF 表格對有效性和安全性的結局顯示相同的前三名干預措施。對于系統評價作者而言,在報告結果的時候需要作出選擇,而無論選擇哪種,對于證據的使用者和決策者可能都不是全面的。
4.2 應用現狀
NMA-SoF 于 2019 年 11 月發表后迅速成為“高被引論文”,Web of Science 上被引頻次已有 10 次,被 9 個 NMA(6 個 Cochrane 系統評價)和 1 個研究方案引用,根據對應領域和出版年中的高引用閾值,被引次數可以歸入其學術領域中最優秀的 1%。目前 Cochrane 協作組已推薦使用 NMA-SoF 表格,但其他雜志、網站、機構的推薦使用稍顯滯后。
4.3 應用前景
NMA-SoF 的目標使用人群包括系統評價作者、指南制訂者、衛生保健專業人員。對于 NMA 作者而言,NMA-SoF 的推廣和應用不僅可提高 NMA 結果報告的規范性,也在一定程度上幫助研究者開展科學規范的研究設計,提升研究質量。對于指南制訂者而言,NMA-SoF 不僅提供證據質量分級的信息,也提供了絕對效應值,方便指南制訂者參考臨床決策閾值進行判斷是否給出推薦。對于衛生保健專業人員而言,NMA-SoF 可以高效地展示 NMA 的研究結果,提高證據的實用性,幫助其做出更加明智的決策。
目前,GRADE 工作組正計劃制訂正式的 NMA-SoF 使用手冊,根據用戶經驗的積累進一步完善 NMA-SoF 以及開發交互式的 SoF 表格,方便納入證據決策框架。