診斷準確性研究報告規范(Standards for Reporting Diagnostic Accuracy Studies,STARD) 2015版在適用性和潛在偏倚新證據的基礎上,對STARD 2003版報告規范的清單和流程圖進行了修訂增補,以更好地指導診斷試驗的規范報告。目前國內診斷性實驗研究報告規范均基于STARD 2003版,本文對STARD 2003版的應用現狀進行描述,并對STARD 2015版進行介紹和解讀。
引用本文: 朱一丹, 李會娟, 武陽豐. 診斷準確性研究報告規范(STARD). 中國循證醫學雜志, 2016, 16(6): 730-735. doi: 10.7507/1672-2531.20160112 復制
診斷準確性研究報告規范(Standards for Reporting Diagnostic Accuracy Studies,STARD)旨在通過加強研究報告的透明度及完整性,以提高診斷性試驗的報告質量。2015年10月,STARD發布了更新版本 [1],新的STARD聲明在適用性和潛在偏倚新證據的基礎上,對STARD 2003的報告規范清單和流程圖進行了修訂增補。清單新增內容加強了對摘要細節、研究假設、樣本量估計、研究局限性和待評價診斷方法的目的及意義的描述,對提升報告透明度提出了具體要求。這些新增條目有助于進一步提高研究的報告質量,更好地指導診斷試驗在臨床實踐中的應用。目前國內診斷性試驗研究報告均基于STARD 2003版 [2]。本文對STARD 2003版的應用現狀進行描述,并對STARD 2015版進行介紹和解讀。
1 發表STARD聲明的意義
診斷準確性研究評價的是某種診斷性試驗正確區分某種特定疾病的患者和非患者的能力,目的可以是診斷、分期、預后或者預測。診斷性試驗真實性的評價常采用靈敏度、特異度、預測值、似然比及ROC曲線下面積等指標來描述。作為研究人員,我們實施和發表診斷性試驗研究,并不只是為了論證研究假設正確與否,更重要的是能讓其他人通過閱讀研究報告,客觀準確地評價診斷試驗的有效性,使臨床醫生、其他醫務工作者和決策者們能夠合理地將研究結果運用到臨床實踐中。不準確的診斷試驗結果不僅會限制后續科學研究如系統評價、臨床實踐指南的價值 [2],在臨床實踐中還會導致錯誤的診斷,進而影響治療決策和患者結局 [3],并造成巨大的醫療資源浪費。
然而,已有研究表明,現有發表的診斷準確性研究中存在多種偏倚 [2, 4]。在研究對象招募、數據收集、待評價診斷方法檢測和數據分析等環節存在的方法學缺陷,會使診斷準確性研究的結果系統地偏離真實情況,從而造成偏倚,降低研究的內部有效性。但是,涉及潛在偏倚的關鍵信息卻往往未進行報告,如是否將全體研究對象都納入了最終分析;是否僅納入健康受試者到對照組,而未考慮其他對照人群;待評價診斷方法和參考標準的間隔時間有多長;多少合格的研究對象未進行待評價診斷方法或參考標準檢測等。已有研究發現,診斷試驗中存在的偏倚通常會夸大研究結果的準確性 [5]。Ochodo等 [6]發現,即使是發表在影響因子較高的期刊上的診斷性研究,仍有約30%的報告過度夸大結果。此外,即便一項診斷試驗不存在偏倚,其研究結果也不一定適用于所有目標人群。因為在不同研究中,診斷試驗的評價指標如靈敏度、特異度、預測值等,會因研究地點、研究對象特征、患病率、疾病嚴重程度以及參考標準選取的不同而存在差異。然而很多研究并未對診斷試驗開展的背景環境,以及何時何地、如何招募合格研究對象等內容進行報告 [7]。因此,不完整的診斷準確性研究報告,尤其是對潛在偏倚報告的不完整,會使讀者無法準確評估診斷試驗的有效性(包括內部有效性和外部有效性)及其在實踐中應用的可能性。這樣一來,對高質量診斷準確性研究報告的需求顯得愈加迫切。1996年隨機對照試驗(RCT)報告規范(CONSORT聲明)發表后,RCT的報告質量得到了顯著提高 [8]。受CONSORT聲明成功的鼓舞,診斷準確性研究報告規范——STARD聲明于2003年問世。
2 STARD 2003版簡介
2003年1月,STARD同時發表于7家生物醫學期刊 [9]。STARD 2003由包含研究人員、臨床流行病學家和編輯在內的國際小組開發,包括一個由25項條目組成的清單,列出了所有診斷準確性研究都應報告的內容,涵蓋研究設計、場所、研究對象選擇、待評價診斷方法參考標準的測量及原理、數據分析和結果部分的關鍵要素。STARD還強烈推薦使用流程圖來說明研究設計和研究對象的診斷流程。STARD的目的不僅在于提高診斷準確性研究的報告質量,還希望以此幫助讀者發現研究存在的潛在偏倚(內部有效性),并合理評估結果的外推性和適用性(外部有效性)。自發表以來,STARD 2003已被300多家生物醫學期刊推薦使用 [10]。其中文譯文 [11]及相關介紹 [12]可參見既往發表的研究。另外,除適用于所有診斷準確性研究的STARD 2003,STARD 聲明還包含多個擴展版本,如針對疾病史和體格檢查 [13]及針對癡呆診斷 [14]的STARD擴展版。
3 更新STARD聲明的必要性
自STARD 2003聲明發表以來,多篇系統評價對發表于STARD聲明前后的診斷準確性研究的報告質量變化進行了分析,得到的普遍共識是,盡管診斷準確性研究的報告質量有所提升,但遠不如預期顯著。有研究發現,STARD聲明發表后,診斷準確性研究報告對STARD條目的遵循僅增加了1.41項 [15],許多文章未對研究對象的納入、排除標準、招募過程及抽樣方法進行完整描述。約1/3的文章未給出測量準確性的可信區間,64%的文章未使用流程圖 [16]。此外,診斷準確性研究對2003版本偏倚報告相關條目的依從率尤其低,甚至不到30% [15]。
此外,研究報告規范不是一成不變的,隨著研究和臨床的發展和更新,報告規范需要重新修訂或擴展,以適應該研究領域不斷發生的變化,提高報告質量。CONSORT聲明自1996年首次發表后,于2001年和2010年兩次修訂并多次擴展。相反,STARD聲明發表十多年來從未更新。目前有新的研究證據提示需對STARD進行修訂 [17]。例如,許多研究未預先設立前提假設,未說明樣本量的計算方式 [6],而缺乏相關信息會影響讀者對潛在偏倚的理解,但STARD 2003對此并無描述。其次,近年來采用生物標記物預測未來臨床事件或患者狀態(如復發、進展、治療反應)的研究越來越多,但這類研究缺乏相應的報告規范。此外,為實現研究的透明化,近年來多鼓勵各類研究通過臨床研究注冊平臺公開研究的重要信息,進行臨床試驗預注冊,并對研究經費來源進行描述,然而STARD 2003中并無相應的要求。以上種種證據表明,有必要對STARD聲明進行修訂與完善。
4 STARD 2015版簡介
2013年,STARD指導委員會經定期文獻回顧,在相關研究證據的支持下決定更新STARD。更新STARD的主要目的有兩個,一是將有關偏倚來源、適用性的新證據整合進STARD清單中,二是增強清單的實用性,使其變得更易理解和使用 [1]。STARD指導委員會邀請了參與制定STARD 2003版的專家及新加入的小組成員共85人,包括研究人員、編輯、出版界人士、數據分析人員、資助方和其他利益相關者在內,對清單的更新范圍發表意見。經過兩輪網絡問卷調查,形成了一份清單初稿。2014年9月在阿姆斯特丹進行了為期2天的會議,指導委員會針對這份初稿進行了討論和預調查,最終完善形成STARD 2015。
此外,盡管STARD聲明設計之初針對的是診斷準確性研究,但STARD聲明的絕大多數條目同樣適用于其他評估診斷方法性能的報告,包括按將來是否發生某種事件對患者進行分類的預后研究、用以檢測或預測不良事件或無應答的監測研究及評估治療選擇性標記物的研究等。相比于不同類型試驗采用不同的報告規范清單,統一采用STARD清單的好處在于清單條目的一致性增強了清單的影響力,更易被作者、同行評議和期刊編輯所采用。
5 STARD 2015新增條目
STARD 2015的清單的整體結構和STARD 2003保持一致,清單條目由原來的25項增加至30項。在這份僅一頁紙的清單上,各條目按照科學論文結構的引言、方法、結果及討論部分進行分組(表 1)。部分條目和STARD 2003完全相同,其他條目則重新經過改寫、組合或拆分。因此,STARD 2015各項條目的編號無法與2003版一一對應。此外,STARD 2015新增了部分條目,包括進一步加強對摘要細節的描述,提高摘要的完整性和清晰度;提供更多關于待評價診斷方法的信息,如明確的研究假設及樣本量估計的信息;新增討論部分的內容包括描述研究的局限性和待評價診斷方法用于特定目的的實際意義如預期用途和作用。最后,為增強報告的透明度,清單還新增了臨床研究注冊、經費來源等相關條目。見表 2。


而新版流程圖對直觀展現研究中的潛在偏倚提出了新的要求,見圖 1。除新增描述研究對象的入選過程,給出未納入對象明確的排除理由外,研究者還需說明每一階段中研究對象未進行待評價診斷方法或“金標準”檢查的理由。使讀者通過流程圖即能直觀地評估研究對象對目標人群的代表性及研究中可能存在的偏倚,如證實偏倚等 [4]。

6 STARD 2015新增條目的解讀
2003年STARD首次發表時,STARD研究小組已對清單中的條目進行了具體說明和解讀,以幫助讀者準確理解各項條目的具體含義 [4]。本文僅針對STARD 2015的新增條目進行闡述。
條目2:摘要結構化。摘要是讀者快速了解一項研究主要內容的重要途徑。通常,會刊及電子數據庫也僅提供文章的摘要部分。對于絕大多數讀者,只有當摘要引起他們足夠的興趣時,才會進一步閱讀正文,以獲取更詳細的文章信息。因此,診斷準確性研究報告的作者有責任提供包括研究背景、設計、方法、結果及結論在內的完整摘要,使讀者通過閱讀摘要,即可對診斷方法的有效性,偏倚及適用性作出初步評價。
條目3:細化研究背景,定義待評價診斷方法的預期用途和作用。診斷試驗是用于收集制定臨床決策信息的方法,其用途不僅限于疾病診斷,還可用于篩查無癥狀體征,疾病分期、監測、預測及評價預后等。通常,診斷試驗應采用適用于某特定目的的方法和設備來評價,包括研究對象、地點、結局目標的選擇等等。其預期用途和作用必須明確定義,這有助于讀者合理評估研究結果的準確性。
條目4:除研究目的外,還需有明確的研究假設。研究假設是一項研究問題提出的基礎,其目的在于尋找某特定問題的答案。拒絕零假設通常表明研究結論支持研究者的預測,即研究結果實現了研究者的預期目標,通常被認為是一項“成功的研究”,反之亦然。因此,缺乏明確的研究假設可能會導致研究者為避免得到“失敗”的研究結果,產生和初始研究目的不一致的多種結果解釋,對結論進行“夸大解讀”。
條目18:樣本量估算。研究者需提供給讀者有關樣本量的全部可能參數,如預期精度、統計效力、是否成功入選到預期的樣本量等。這些信息對讀者準確評估診斷方法的準確性非常重要。增大樣本量可減少估算靈敏度和特異度時的不確定性。但是過大的樣本量會導致時間、資源的浪費,而過小的樣本量則可能無法檢測到效應的存在。
條目26、27:結構化討論內容,增加研究局限性。研究存在的局限性或多或少會對研究結果產生影響,嚴重者甚至會完全推翻已有結論。對研究的局限性,如研究方法、樣本量、潛在偏倚及外推性進行全面評價和解釋,可使讀者清晰認識到這些因素對研究結論造成影響的嚴重程度,并客觀評估研究結果的真實性、準確性。這樣一來,不僅可以防止過早得出毫無根據的研究結論,還可為進一步的研究提供建議和方向。此外,只有當研究結論是基于診斷試驗的具體應用目的,并與之相符時,才能反映出該研究的實際應用價值和意義。
條目28:前瞻性的診斷試驗需提前注冊。前瞻性的診斷準確性研究屬于試驗設計,正因如此,該類研究在實施前需在臨床研究注冊平臺,如ClinicalTrail.gov 或中國臨床試驗注冊中心(ChiC-TR)上公開注冊。這有助于其他研究者、讀者及潛在研究對象獲得研究相關信息,在增加研究認知度的同時,提高研究過程的規范性并防止選擇性報告。目前國際上大多數高質量期刊都將試驗研究提供預注冊信息作為接受文章發表的前提。
條目29:研究方案提前發表或公開。完整的研究方案包含更多有關預定義的研究方法信息,如目標人群、研究者招募、知情同意過程、數據收集和分析計劃、質控過程等。對完整研究方案信息的獲取有助于讀者進行批判性的閱讀。
條目30:注明經費資助來源。學術期刊論文發表中存在利益沖突問題,診斷準確性研究也不例外。 研究人員與經費贊助商間的潛在利益沖突,如金錢利益,可能會對研究的真實性產生影響,使存在利益沖突的作者偏離科學和道德原則,更傾向于呈現陽性結果,即發表偏倚。因此,有必要將二者間的潛在利益沖突公開化,如研究的經費來源,經費贊助者在文章中所處的角色。
7 小結
不完整的報告被認為是對生物醫學研究的浪費 [18],而STARD聲明作為改善報告不完整性的有效方式之一,正發揮著積極作用。2015年STARD更新版本對STARD清單及流程圖進行了重新修訂和完善,使得診斷研究報告變得更透明、公開,能提供更多信息幫助研究者和讀者決定是否接受、推薦或否認該種診斷方法。近年來的研究提示,STARD只能適度提高診斷報告的質量。即便是采用了STARD聲明的高質量雜志,診斷報告對STARD聲明整體遵循程度依舊不高,這極大程度地限制了STARD本應發揮的有效作用。因此,作為研究者,應提高對報告完整性,減小潛在偏倚的意識;對于讀者,應從STARD聲明的視角批判性地對研究設計的基本特性進行審讀,而不是無條件地接受作者的觀點。最終,希望無論是研究者、醫護人員還是患者,都能夠從完整、透明、公開的報告中獲取信息并受益。
診斷準確性研究報告規范(Standards for Reporting Diagnostic Accuracy Studies,STARD)旨在通過加強研究報告的透明度及完整性,以提高診斷性試驗的報告質量。2015年10月,STARD發布了更新版本 [1],新的STARD聲明在適用性和潛在偏倚新證據的基礎上,對STARD 2003的報告規范清單和流程圖進行了修訂增補。清單新增內容加強了對摘要細節、研究假設、樣本量估計、研究局限性和待評價診斷方法的目的及意義的描述,對提升報告透明度提出了具體要求。這些新增條目有助于進一步提高研究的報告質量,更好地指導診斷試驗在臨床實踐中的應用。目前國內診斷性試驗研究報告均基于STARD 2003版 [2]。本文對STARD 2003版的應用現狀進行描述,并對STARD 2015版進行介紹和解讀。
1 發表STARD聲明的意義
診斷準確性研究評價的是某種診斷性試驗正確區分某種特定疾病的患者和非患者的能力,目的可以是診斷、分期、預后或者預測。診斷性試驗真實性的評價常采用靈敏度、特異度、預測值、似然比及ROC曲線下面積等指標來描述。作為研究人員,我們實施和發表診斷性試驗研究,并不只是為了論證研究假設正確與否,更重要的是能讓其他人通過閱讀研究報告,客觀準確地評價診斷試驗的有效性,使臨床醫生、其他醫務工作者和決策者們能夠合理地將研究結果運用到臨床實踐中。不準確的診斷試驗結果不僅會限制后續科學研究如系統評價、臨床實踐指南的價值 [2],在臨床實踐中還會導致錯誤的診斷,進而影響治療決策和患者結局 [3],并造成巨大的醫療資源浪費。
然而,已有研究表明,現有發表的診斷準確性研究中存在多種偏倚 [2, 4]。在研究對象招募、數據收集、待評價診斷方法檢測和數據分析等環節存在的方法學缺陷,會使診斷準確性研究的結果系統地偏離真實情況,從而造成偏倚,降低研究的內部有效性。但是,涉及潛在偏倚的關鍵信息卻往往未進行報告,如是否將全體研究對象都納入了最終分析;是否僅納入健康受試者到對照組,而未考慮其他對照人群;待評價診斷方法和參考標準的間隔時間有多長;多少合格的研究對象未進行待評價診斷方法或參考標準檢測等。已有研究發現,診斷試驗中存在的偏倚通常會夸大研究結果的準確性 [5]。Ochodo等 [6]發現,即使是發表在影響因子較高的期刊上的診斷性研究,仍有約30%的報告過度夸大結果。此外,即便一項診斷試驗不存在偏倚,其研究結果也不一定適用于所有目標人群。因為在不同研究中,診斷試驗的評價指標如靈敏度、特異度、預測值等,會因研究地點、研究對象特征、患病率、疾病嚴重程度以及參考標準選取的不同而存在差異。然而很多研究并未對診斷試驗開展的背景環境,以及何時何地、如何招募合格研究對象等內容進行報告 [7]。因此,不完整的診斷準確性研究報告,尤其是對潛在偏倚報告的不完整,會使讀者無法準確評估診斷試驗的有效性(包括內部有效性和外部有效性)及其在實踐中應用的可能性。這樣一來,對高質量診斷準確性研究報告的需求顯得愈加迫切。1996年隨機對照試驗(RCT)報告規范(CONSORT聲明)發表后,RCT的報告質量得到了顯著提高 [8]。受CONSORT聲明成功的鼓舞,診斷準確性研究報告規范——STARD聲明于2003年問世。
2 STARD 2003版簡介
2003年1月,STARD同時發表于7家生物醫學期刊 [9]。STARD 2003由包含研究人員、臨床流行病學家和編輯在內的國際小組開發,包括一個由25項條目組成的清單,列出了所有診斷準確性研究都應報告的內容,涵蓋研究設計、場所、研究對象選擇、待評價診斷方法參考標準的測量及原理、數據分析和結果部分的關鍵要素。STARD還強烈推薦使用流程圖來說明研究設計和研究對象的診斷流程。STARD的目的不僅在于提高診斷準確性研究的報告質量,還希望以此幫助讀者發現研究存在的潛在偏倚(內部有效性),并合理評估結果的外推性和適用性(外部有效性)。自發表以來,STARD 2003已被300多家生物醫學期刊推薦使用 [10]。其中文譯文 [11]及相關介紹 [12]可參見既往發表的研究。另外,除適用于所有診斷準確性研究的STARD 2003,STARD 聲明還包含多個擴展版本,如針對疾病史和體格檢查 [13]及針對癡呆診斷 [14]的STARD擴展版。
3 更新STARD聲明的必要性
自STARD 2003聲明發表以來,多篇系統評價對發表于STARD聲明前后的診斷準確性研究的報告質量變化進行了分析,得到的普遍共識是,盡管診斷準確性研究的報告質量有所提升,但遠不如預期顯著。有研究發現,STARD聲明發表后,診斷準確性研究報告對STARD條目的遵循僅增加了1.41項 [15],許多文章未對研究對象的納入、排除標準、招募過程及抽樣方法進行完整描述。約1/3的文章未給出測量準確性的可信區間,64%的文章未使用流程圖 [16]。此外,診斷準確性研究對2003版本偏倚報告相關條目的依從率尤其低,甚至不到30% [15]。
此外,研究報告規范不是一成不變的,隨著研究和臨床的發展和更新,報告規范需要重新修訂或擴展,以適應該研究領域不斷發生的變化,提高報告質量。CONSORT聲明自1996年首次發表后,于2001年和2010年兩次修訂并多次擴展。相反,STARD聲明發表十多年來從未更新。目前有新的研究證據提示需對STARD進行修訂 [17]。例如,許多研究未預先設立前提假設,未說明樣本量的計算方式 [6],而缺乏相關信息會影響讀者對潛在偏倚的理解,但STARD 2003對此并無描述。其次,近年來采用生物標記物預測未來臨床事件或患者狀態(如復發、進展、治療反應)的研究越來越多,但這類研究缺乏相應的報告規范。此外,為實現研究的透明化,近年來多鼓勵各類研究通過臨床研究注冊平臺公開研究的重要信息,進行臨床試驗預注冊,并對研究經費來源進行描述,然而STARD 2003中并無相應的要求。以上種種證據表明,有必要對STARD聲明進行修訂與完善。
4 STARD 2015版簡介
2013年,STARD指導委員會經定期文獻回顧,在相關研究證據的支持下決定更新STARD。更新STARD的主要目的有兩個,一是將有關偏倚來源、適用性的新證據整合進STARD清單中,二是增強清單的實用性,使其變得更易理解和使用 [1]。STARD指導委員會邀請了參與制定STARD 2003版的專家及新加入的小組成員共85人,包括研究人員、編輯、出版界人士、數據分析人員、資助方和其他利益相關者在內,對清單的更新范圍發表意見。經過兩輪網絡問卷調查,形成了一份清單初稿。2014年9月在阿姆斯特丹進行了為期2天的會議,指導委員會針對這份初稿進行了討論和預調查,最終完善形成STARD 2015。
此外,盡管STARD聲明設計之初針對的是診斷準確性研究,但STARD聲明的絕大多數條目同樣適用于其他評估診斷方法性能的報告,包括按將來是否發生某種事件對患者進行分類的預后研究、用以檢測或預測不良事件或無應答的監測研究及評估治療選擇性標記物的研究等。相比于不同類型試驗采用不同的報告規范清單,統一采用STARD清單的好處在于清單條目的一致性增強了清單的影響力,更易被作者、同行評議和期刊編輯所采用。
5 STARD 2015新增條目
STARD 2015的清單的整體結構和STARD 2003保持一致,清單條目由原來的25項增加至30項。在這份僅一頁紙的清單上,各條目按照科學論文結構的引言、方法、結果及討論部分進行分組(表 1)。部分條目和STARD 2003完全相同,其他條目則重新經過改寫、組合或拆分。因此,STARD 2015各項條目的編號無法與2003版一一對應。此外,STARD 2015新增了部分條目,包括進一步加強對摘要細節的描述,提高摘要的完整性和清晰度;提供更多關于待評價診斷方法的信息,如明確的研究假設及樣本量估計的信息;新增討論部分的內容包括描述研究的局限性和待評價診斷方法用于特定目的的實際意義如預期用途和作用。最后,為增強報告的透明度,清單還新增了臨床研究注冊、經費來源等相關條目。見表 2。


而新版流程圖對直觀展現研究中的潛在偏倚提出了新的要求,見圖 1。除新增描述研究對象的入選過程,給出未納入對象明確的排除理由外,研究者還需說明每一階段中研究對象未進行待評價診斷方法或“金標準”檢查的理由。使讀者通過流程圖即能直觀地評估研究對象對目標人群的代表性及研究中可能存在的偏倚,如證實偏倚等 [4]。

6 STARD 2015新增條目的解讀
2003年STARD首次發表時,STARD研究小組已對清單中的條目進行了具體說明和解讀,以幫助讀者準確理解各項條目的具體含義 [4]。本文僅針對STARD 2015的新增條目進行闡述。
條目2:摘要結構化。摘要是讀者快速了解一項研究主要內容的重要途徑。通常,會刊及電子數據庫也僅提供文章的摘要部分。對于絕大多數讀者,只有當摘要引起他們足夠的興趣時,才會進一步閱讀正文,以獲取更詳細的文章信息。因此,診斷準確性研究報告的作者有責任提供包括研究背景、設計、方法、結果及結論在內的完整摘要,使讀者通過閱讀摘要,即可對診斷方法的有效性,偏倚及適用性作出初步評價。
條目3:細化研究背景,定義待評價診斷方法的預期用途和作用。診斷試驗是用于收集制定臨床決策信息的方法,其用途不僅限于疾病診斷,還可用于篩查無癥狀體征,疾病分期、監測、預測及評價預后等。通常,診斷試驗應采用適用于某特定目的的方法和設備來評價,包括研究對象、地點、結局目標的選擇等等。其預期用途和作用必須明確定義,這有助于讀者合理評估研究結果的準確性。
條目4:除研究目的外,還需有明確的研究假設。研究假設是一項研究問題提出的基礎,其目的在于尋找某特定問題的答案。拒絕零假設通常表明研究結論支持研究者的預測,即研究結果實現了研究者的預期目標,通常被認為是一項“成功的研究”,反之亦然。因此,缺乏明確的研究假設可能會導致研究者為避免得到“失敗”的研究結果,產生和初始研究目的不一致的多種結果解釋,對結論進行“夸大解讀”。
條目18:樣本量估算。研究者需提供給讀者有關樣本量的全部可能參數,如預期精度、統計效力、是否成功入選到預期的樣本量等。這些信息對讀者準確評估診斷方法的準確性非常重要。增大樣本量可減少估算靈敏度和特異度時的不確定性。但是過大的樣本量會導致時間、資源的浪費,而過小的樣本量則可能無法檢測到效應的存在。
條目26、27:結構化討論內容,增加研究局限性。研究存在的局限性或多或少會對研究結果產生影響,嚴重者甚至會完全推翻已有結論。對研究的局限性,如研究方法、樣本量、潛在偏倚及外推性進行全面評價和解釋,可使讀者清晰認識到這些因素對研究結論造成影響的嚴重程度,并客觀評估研究結果的真實性、準確性。這樣一來,不僅可以防止過早得出毫無根據的研究結論,還可為進一步的研究提供建議和方向。此外,只有當研究結論是基于診斷試驗的具體應用目的,并與之相符時,才能反映出該研究的實際應用價值和意義。
條目28:前瞻性的診斷試驗需提前注冊。前瞻性的診斷準確性研究屬于試驗設計,正因如此,該類研究在實施前需在臨床研究注冊平臺,如ClinicalTrail.gov 或中國臨床試驗注冊中心(ChiC-TR)上公開注冊。這有助于其他研究者、讀者及潛在研究對象獲得研究相關信息,在增加研究認知度的同時,提高研究過程的規范性并防止選擇性報告。目前國際上大多數高質量期刊都將試驗研究提供預注冊信息作為接受文章發表的前提。
條目29:研究方案提前發表或公開。完整的研究方案包含更多有關預定義的研究方法信息,如目標人群、研究者招募、知情同意過程、數據收集和分析計劃、質控過程等。對完整研究方案信息的獲取有助于讀者進行批判性的閱讀。
條目30:注明經費資助來源。學術期刊論文發表中存在利益沖突問題,診斷準確性研究也不例外。 研究人員與經費贊助商間的潛在利益沖突,如金錢利益,可能會對研究的真實性產生影響,使存在利益沖突的作者偏離科學和道德原則,更傾向于呈現陽性結果,即發表偏倚。因此,有必要將二者間的潛在利益沖突公開化,如研究的經費來源,經費贊助者在文章中所處的角色。
7 小結
不完整的報告被認為是對生物醫學研究的浪費 [18],而STARD聲明作為改善報告不完整性的有效方式之一,正發揮著積極作用。2015年STARD更新版本對STARD清單及流程圖進行了重新修訂和完善,使得診斷研究報告變得更透明、公開,能提供更多信息幫助研究者和讀者決定是否接受、推薦或否認該種診斷方法。近年來的研究提示,STARD只能適度提高診斷報告的質量。即便是采用了STARD聲明的高質量雜志,診斷報告對STARD聲明整體遵循程度依舊不高,這極大程度地限制了STARD本應發揮的有效作用。因此,作為研究者,應提高對報告完整性,減小潛在偏倚的意識;對于讀者,應從STARD聲明的視角批判性地對研究設計的基本特性進行審讀,而不是無條件地接受作者的觀點。最終,希望無論是研究者、醫護人員還是患者,都能夠從完整、透明、公開的報告中獲取信息并受益。