引用本文: SHASHIShah, 劉潤文, 蔡合, 彭兵. 臨床胰瘺動態預測模型對腹腔鏡胰十二指腸切除術中是否留置胰管支撐管的預測性能評估. 中國普外基礎與臨床雜志, 2021, 28(9): 1137-1143. doi: 10.7507/1007-9424.202105050 復制
對于腹腔鏡胰十二指腸切除術(laparoscopic pancreaticoduodenectomy,LPD)來講,臨床胰瘺(clinically-relevant postoperative pancreatic fistula,CR-POPF)是術后較常見且最為嚴重的并發癥,容易繼發腹腔感染、術后腹腔出血、圍術期死亡等不良后果[1-3]。由于該并發癥帶來的嚴重后果及其對臨床干預帶來的巨大影響,對它的預測成為了胰腺外科研究的熱點問題。 然而,對于亞洲人群而言,目前較通用的預測模型如胰瘺風險評分(fistula risk score,FRS)、改良 FRS(alternate FRS,a-FRS)、超改良 FRS(ultra-alternate FRS,ua-FRS)等,在亞洲人群中因較低的預測效能而使其普適性和臨床可用性受限[4-7],且以上模型的預測結果不能隨患者術后恢復情況的變化而及時調整。
為解決上述問題,前期筆者所在團隊對 2016 年 4 月至 2019 年 1 月期間在筆者所在醫院接受 LPD 的 251 例患者的臨床資料進行回顧性研究,并建立了動態預測 CR-POPF 的模型[8],該動態預測模型的優點是可以根據術后血液指標及引流液指標,實時監測患者胰瘺的轉歸情況。 此后,筆者所在團隊開展了胰管支撐管隨機臨床對照試驗(randomized clinical trial,RCT)研究,旨在探討術中不留置支撐管的患者的胰瘺發生情況及相應情況下患者圍術期的安全性。該 RCT 實驗亦為動態預測 CR-POPF 的模型的驗證創立了條件,并因其實驗及模型驗證本身具有的特性而為填補該模型建立過程中留下的空白提供了數據和技術上的支持。
本研究中,筆者運用了該動態預測模型對可能發展成 CR-POPF 的概率進行了預測,并對該模型預測的準確率、區分能力及穩定性進行進一步的前瞻性驗證,以了解該模型的普適性,并提前預警便于早期干預,避免 CR-POPF 帶來的嚴重并發癥,從而有利于 LPD 的安全和順利開展。
1 資料與方法
1.1 病例納入及排除標準
1.1.1 納入標準
① 具有 LPD 手術適應證的患者;② 既往無化療、放療或腹部手術史;③ 心肺功能基本正常;④ 年齡在 18~75 歲,性別不限;⑤ 體力狀況尚好,Karnofsky 評分≥70 分;⑥ 患者及家屬知情并簽署了知情同意書。
1.1.2 排除標準
① 術中因各種原因中轉開腹者; ② 術中無法找到胰管者;③ 妊娠或哺乳期患者;④ 多器官功能不全如嚴重腎、肝、心功能不全者;⑤ 精神異常或有精神病史且不能自主配合者;⑥ 3 個月內參加過其他臨床試驗者;⑦ 存在研究人員認為不適宜進入研究的其他情況。
1.2 病例資料
根據納入和排除標準,本研究納入 2019 年 11 月至 2020 年 10 月期間在四川大學華西醫院行 LPD 患者 66 例。通過醫院信息系統(hospital information system,HIS)及手術過程所見,實時收集患者的住院號、姓名、性別、年齡、體質量指數(BMI)、術前總膽紅素、血紅蛋白、美國麻醉醫師協會(American Society of Anesthesiologist,ASA)分級、手術時間、術中出血量、胰腺支撐管留置情況、胰腺質地、血管切除重建情況、胰管直徑等基線資料,以及術前 1 周內患者血清白蛋白、血肌酐,術后第 2、3、5 天的引流液淀粉酶水平、C-反應蛋白與血清白蛋白的比值(C-reactive protein to albumin,CAR)等模型相關因素,并根據國際胰腺外科手術研究小組(International Study Group of Pancreatic Surgery,ISGPS)的定義[9]逐例對患者的胰瘺及其發生與否進行診斷和評級。為保證信息的準確性,以上病例信息通過“雙錄入”“雙核對”的方式進行。該研究已進行臨床試驗注冊(注冊號: ChiCTR1900026653)并通過了四川大學華西醫院倫理委員會的審批 [批文編號:2019 年審(1180)號]。
1.3 變量與定義
基線因素包括病例的基本信息、術前 1 周內的檢查指標以及手術實施相關因素 3 個部分。其中病例的基本信息包括性別、年齡、BMI;術前 1 周內檢查指標包括術前總膽紅素、術前血紅蛋白;手術相關指標包括術前減黃情況、ASA 分級、手術時間、手術估計出血量、胰腺質地、血管切除重建情況、胰管直徑等。本研究擬對動態預測 LPD 術后 CR-POPF 模型[8]進行驗證,該研究所涉及的模型相關變量包括:術前 1 周內的血清白蛋白、血肌酐;術后第 2、3 和 5 天的引流液淀粉酶水平;以及這些時間點的 C-反應蛋白與血清白蛋白的比值(C-reactive protein to albumin ratio,CAR)。結局變量是 CR-POPF 的發生與否,根據 ISGPS 定義[9],CR-POPF 包括 B 級和 C 級胰瘺。
1.4 模型驗證
本研究根據動態預測 CR-POPF 模型[8]計算每例患者在術后不同時間點(術后第 2、3 和 5 天)的 CR-POPF 危險預測值,通過逐個時刻(術后第 2、3 和 5 天)的模型預測值界值點預測本隊列整體及 LPD 術中留置主胰管支撐管與否的患者的術后 CR-POPF 之特異度、敏感度和預測準確率評估該模型的預測準確性,并通過繪制該模型預測本隊列及放置/不放置支撐管亞組的 ROC 曲線衡量該模型預測值的區分度,包括 ROC 曲線下面積及其 95% 置信區間,以及根據 ROC 曲線確定的新界值點下的特異度和敏感度。同時,本研究還計算了模型預測值界值點和根據上述通過本隊列繪制的 ROC 曲線下的模型預測值新界值點所確定的 2 個不同預測結論的 Kappa 值[10],以衡量該模型預測結論自身具備的穩定性。
1.5 統計學方法
本研究采用 SPSS v.23.0 (IBM Corp.,Armonk,NY) 進行統計學分析。對連續變量且服從正態分布的計量資料用均數±標準差(±s)表示,并通過成組 t 檢驗分析組間統計學差異;不服從正態分布的計量資料用 M(P25,P75)表示,并通過 Mann-Whitney 檢驗分析組間統計學差異。對有序變量,本研究亦通過 Mann-Whitney 檢驗分析組間統計學差異。對分類變量,本研究采用成組 χ2 檢驗或 Fisher 精確法。檢驗水準 α=0.05(雙側檢驗)。
2 結果
2.1 隊列的基本情況
2.1.1 基線因素
本研究納入動態預測模型的 2 組患者的基線因素具體見表 1。

2.1.2 模型相關因素及 LPD 術后胰瘺發生情況
本研究納入動態預測模型的 2 組患者的模型相關因素以及 LPD 術后胰瘺發生情況具體見表 2。

2.2 動態預測模型的預測能力驗證結果
2.2.1 模型的準確性和區分能力驗證結果
就模型及其對應預測臨界值的準確性而言,動態預測模型對 CR-POPF 的預測,其在術后第 2、3 和 5 天對整體隊列預測的特異度分別為 91.7%、82.8% 和 61.5%,敏感度分別為 33.3%、75.0% 和 75.0%,預測準確率分別為 88.2%、82.3% 和 66.1%。其中在支撐管組,模型對術后第 2、3 和 5 天 CR-POPF 預測的特異度分別為 92.0%、76.7% 和 57.1%,敏感度分別為 50.0%、100% 和 66.7%,預測準確率分別為 88.8%、78.8% 和 61.3%。 而在無支撐管組模型對術后第 2、3 和 5 天 CR-POPF 預測的特異度分別為 91.3%、89.3% 和 66.7%,敏感度分別為 0.0%、0.0% 和 100%,預測準確率分別為 87.5%、86.2% 和 72.0%。
從模型預測值的區分度來看,多數時間點下的 ROC 曲線下面積及其 95% 置信區間 [AUC(95%CI)]提示該模型預測值對本研究整體隊列具有較好至很好的區分性能,其在術后第 2、3 和 5 天分別為 0.674 (0.308,1.000),0.894 (0.772,1.000),和 0.781 (0.596,0.966)。其中術后第 3 天的預測值其曲線下面積最大,可區分性最為明顯。其在術后第 2、3 和 5 天的模型預測值界值點分別為 5.4%、21.9% 及 6.1%,與之對應的特異度和敏感度分別為 72.9%、93.1% 和 57.7% 以及 66.7%、75.0% 和 100%。動態預測模型對術后不同時間點整體隊列 CR-POPF 預測風險值的 ROC 曲線及界值點見圖 1a-1c。

a–c:整體隊列的 ROC 曲線及界值點;d–f:無支撐管組的 ROC 曲線及界值點;g–i:支撐管組的 ROC 曲線及界值點;三角處表示 ROC 曲線上的界值點
在無支撐管組中,各時間點的 AUC 及其 95%CI 提示,除術后第 2 天 [0.304(0.067,0.541)]外,該模型在其他時間點(術后第 3 及 5 天)的區分度較好至很好,術后第 3 天為 0.821(0.659,0.984),術后第 5 天為 0.958(0.878,1.000),其中術后第 5 天的模型預測值可區分性最為明顯。對該組病例,除術后第 2 天外,在模型預測值可區分 LPC 術后 CR-POPF 發生與否的兩時間點(術后第 3 和 5 天),模型預測值的界值點分別為 5.2% 和 36.7%,與之對應的特異度分別為 75% 和 95.8%,敏感度則分別為 100% 和 100%(圖 1d-1f)。
而對于放置支撐管的隊列而言,該模型于術后第 2、3 和 5 天的預測值的 AUC 及其 95%CI 分別為 0.870(0.685,1.000)、0.956(0.885,1.000)和 0.702(0.451,0.953),對應的模型預測值界值點與整體隊列相同,分別為 5.4%、21.9% 及 6.1%。在術后第 2、3 和 5 天,模型預測值界值點預測術后 CR-POPF 發生的特異度分別為 72.0%、93.3% 和 53.6%,敏感度則在各個時刻均為 100% (圖 1g-1i)。
2.2.2 模型預測結論的穩定性驗證結果
對于整體隊列而言,術后第 2、3 和 5 天的動態預測模型界值點和上述 ROC 曲線上界值點的 2 個不同預測結論的 Kappa 值分別為 0.414、0.648 和 0.781。 其中,無支撐管組于術后第 3 和 5 天的不同預測結論的 Kappa 值分別為 0.465 和 0.449(無支撐管組術后第 2 天的模型預測值無法預測 CR-POPF 發生,故其 Kappa 值未計算),而支撐管組逐個時間點的該值分別為 0.308、0.582 和 0.744。
3 討論
本研究結果以小驗證集樣本前瞻性同中心驗證了 CR-POPF 動態預測模型的所具有的外延適用性[11],并由此填補了模型建立過程中所留下的空白[8]。一方面,從模型預測值的區分性上看,本研究的動態預測模型可在多數情況下較好地在整體隊列中篩查出較易發生 LPD 術后 CR-POPF 的病例,其中術后第 3 天的結果尤為準確。另一方面,從整體隊列上看,無論是根據隊列 ROC 曲線確定界值點,還是模型開發過程中按照建模病例所確定的臨界值[8],其界值點基本波動在 5%~20% 之間,前后 2 個不同界值點下的預測結論一致性可以達到良好的水平,由此證實了該模型篩查 CR-POPF 的結果具有一定程度的穩定性。
就模型的以上特性在 LPD 術中是否放置主胰管支撐管的病例中的表現結果上看,該模型更適用于 LPD 術中放置胰管支撐管的人群,表現為相對較高的預測準確性、模型預測值較好的區分能力以及更高的篩查結果穩定性,這是由于筆者所在醫院腹腔鏡微創中心在完成 LPD 的過程中,一般采用常規放胰管支撐管的方式完成胰腸吻合,使得該動態預測 CR-POPF 模型的建模隊列中放置支撐管的病例占據多數,從而在某種意義上講,該模型在 LPD 術中未放置胰腺支撐管的隊列中進行的驗證屬于一種“外部驗證” 。即便如此,該模型在不放置胰腺支撐管組中的驗證表現亦凸顯出其在術后第 5 天的篩查價值和預測結果的穩定性(術后第 3 天可以>36.7% 的預測值預測 CR-POPF 的發生),相比于僅依據引流液淀粉酶水平在術后第 3 天確定為臨床意義較低的生化漏[9],此時該模型對 CR-POPF 發生的預測結論可以更好地選擇患者進行 CR-POPF 發生的管理、檢測和預防。
關于 LPD 術后 CR-POPF 的預測,目前文獻的報道多以多因素靜態模型為主,如 FRS 評分、a-FRS 以及 ua-FRS 系統,以及女性、高齡、軟胰、主胰管直徑細小等胰瘺高危因素均被納入其中[12-15]。事實上,與 CR-POPF 發生相關的因素可達 10 余種,包括主要和次要的影響因素[16-18],其中低血清白蛋白、腎功能損傷、術后引流液淀粉酶升高、術后強烈的全身炎癥反應等,均已被證實為 LPD 術后 CR-POPF 的強相關因素[19-20]。然而由于群體抽樣導致的樣本具有的變異性,多個影響較小的因素在不同的報道中出現不同的結論。本研究所涉及到的動態預測 CR-POPF 模型使用了上述強相關因素[8],通過在不同時間點做 4 道快速選擇題的方式,提供隨時可以調整的預測結果[21-22],從而便于我們對不同危險度分級的患者進行胰瘺管理,如生長抑素、帕瑞肽、氫化可的松、和“三藥聯用”(加貝脂+奧曲肽+碳青霉烯類抗生素)等[22-25],從而更大程度上減少高危人群發生 CR-POPF 的可能。
盡管 CR-POPF 的發生率較前有降低,且術后第 1 和 2 天的指標的區分度在不同的模型和不同的報道中因指標波動變化的時間窗變異而有所爭議[26-29],但適度調整界值點后,該模型較高的敏感度仍然決定了其具有對 LPD 術后 CR-POPF 高風險病例的篩查功能,并根據指標對應的情況采取不同的胰瘺管理措施。 從綜合預測能力的不同方面來看,術后第 3 天的預測結果更具有臨床上的判別意義。畢竟,無論是 LPD 術中放置胰管支撐管與否,其術后第 3 天的高區分度和高穩定性亦使得該時間點不僅成為了生化漏的診斷時間[9],而且結合模型其他標準,亦成為了 CR-POPF 發生與否的分水嶺。此外,由于 CR-POPF 發生的時間往往發生在 LPD 術后第 5 天以后[9],該時間點較好的模型預測價值亦使得在該時間點指標的變化和模型預測結果的變化成為了一個較好的調整臨床干預措施的依據。對于模型外的因素,由于它對 LPD 術后 CR-POPF 的影響亦不可完全忽略不計[15],臨床上使用該模型的過程中,亦要考慮到病例在其他因素上所具備的情況。
本研究存在一定的局限如下:首先,本研究的隊列樣本量偏少,以至于在此基礎上區分亞組后,未放置支撐管亞組的個別驗證過程未能得出有效結果; 其二,相對于大部分相關研究[1-3]的報道結果,本研究隊列的 CR-POPF 發生率更低,盡管這個因素影響到了結果的效度,但低的 LPD 術后 CR-POPF 發生率亦歸功于筆者所在中心術后胰瘺管理在近年來的提高;另外,盡管本研究實施僅局限于筆者所在中心的 RCT 隊列,但該研究的結果填補了原始模型缺乏驗證集的空白,并證實了該預測模型的臨床可用性。
綜上所述,CR-POPF 動態模型整體上更適用于筆者所在醫院 LPD 術中置胰管支撐管的患者,在該類人群中可更準確地篩查 CR-POPF 高危人群,其篩查結果穩定性較好。在術后第 3 和 5 天,若靈活調整預測值的界值點,該模型亦可對 LPD 術中未放置胰管支撐管的患者進行術后 CR-POPF發生的預測。故對于依照該預測模型被界定為紅框范圍以內的病例,需要采取預防 CR-POPF 發生之措施,紅框范圍附近的,需要綜合考慮 CR-POPF 發生的其他危險因素。該模型通過了筆者所在醫院的前瞻性試驗的驗證,但需要外院更多的 LPD 病例進行前瞻性驗證。
重要聲明
利益沖突聲明:本文所有作者聲明不存在與本研究相關的利益沖突關系。
作者貢獻聲明: SHASHI Shah 和彭兵是本研究的實驗設計和實驗研究的執行人和負責人;蔡合和 SHASHI Shah 收集和校對本研究涉及的臨床數據;劉潤文完成本文的數據及試驗結果分析以及本文的撰寫;蔡合和彭兵負責修改論文。全體作者都閱讀并同意最終的文本。
倫理聲明:本研究已通過四川大學華西醫院生物醫學倫理審查委員會的審批 [批文編號:2019 年審(1180)號]。
對于腹腔鏡胰十二指腸切除術(laparoscopic pancreaticoduodenectomy,LPD)來講,臨床胰瘺(clinically-relevant postoperative pancreatic fistula,CR-POPF)是術后較常見且最為嚴重的并發癥,容易繼發腹腔感染、術后腹腔出血、圍術期死亡等不良后果[1-3]。由于該并發癥帶來的嚴重后果及其對臨床干預帶來的巨大影響,對它的預測成為了胰腺外科研究的熱點問題。 然而,對于亞洲人群而言,目前較通用的預測模型如胰瘺風險評分(fistula risk score,FRS)、改良 FRS(alternate FRS,a-FRS)、超改良 FRS(ultra-alternate FRS,ua-FRS)等,在亞洲人群中因較低的預測效能而使其普適性和臨床可用性受限[4-7],且以上模型的預測結果不能隨患者術后恢復情況的變化而及時調整。
為解決上述問題,前期筆者所在團隊對 2016 年 4 月至 2019 年 1 月期間在筆者所在醫院接受 LPD 的 251 例患者的臨床資料進行回顧性研究,并建立了動態預測 CR-POPF 的模型[8],該動態預測模型的優點是可以根據術后血液指標及引流液指標,實時監測患者胰瘺的轉歸情況。 此后,筆者所在團隊開展了胰管支撐管隨機臨床對照試驗(randomized clinical trial,RCT)研究,旨在探討術中不留置支撐管的患者的胰瘺發生情況及相應情況下患者圍術期的安全性。該 RCT 實驗亦為動態預測 CR-POPF 的模型的驗證創立了條件,并因其實驗及模型驗證本身具有的特性而為填補該模型建立過程中留下的空白提供了數據和技術上的支持。
本研究中,筆者運用了該動態預測模型對可能發展成 CR-POPF 的概率進行了預測,并對該模型預測的準確率、區分能力及穩定性進行進一步的前瞻性驗證,以了解該模型的普適性,并提前預警便于早期干預,避免 CR-POPF 帶來的嚴重并發癥,從而有利于 LPD 的安全和順利開展。
1 資料與方法
1.1 病例納入及排除標準
1.1.1 納入標準
① 具有 LPD 手術適應證的患者;② 既往無化療、放療或腹部手術史;③ 心肺功能基本正常;④ 年齡在 18~75 歲,性別不限;⑤ 體力狀況尚好,Karnofsky 評分≥70 分;⑥ 患者及家屬知情并簽署了知情同意書。
1.1.2 排除標準
① 術中因各種原因中轉開腹者; ② 術中無法找到胰管者;③ 妊娠或哺乳期患者;④ 多器官功能不全如嚴重腎、肝、心功能不全者;⑤ 精神異常或有精神病史且不能自主配合者;⑥ 3 個月內參加過其他臨床試驗者;⑦ 存在研究人員認為不適宜進入研究的其他情況。
1.2 病例資料
根據納入和排除標準,本研究納入 2019 年 11 月至 2020 年 10 月期間在四川大學華西醫院行 LPD 患者 66 例。通過醫院信息系統(hospital information system,HIS)及手術過程所見,實時收集患者的住院號、姓名、性別、年齡、體質量指數(BMI)、術前總膽紅素、血紅蛋白、美國麻醉醫師協會(American Society of Anesthesiologist,ASA)分級、手術時間、術中出血量、胰腺支撐管留置情況、胰腺質地、血管切除重建情況、胰管直徑等基線資料,以及術前 1 周內患者血清白蛋白、血肌酐,術后第 2、3、5 天的引流液淀粉酶水平、C-反應蛋白與血清白蛋白的比值(C-reactive protein to albumin,CAR)等模型相關因素,并根據國際胰腺外科手術研究小組(International Study Group of Pancreatic Surgery,ISGPS)的定義[9]逐例對患者的胰瘺及其發生與否進行診斷和評級。為保證信息的準確性,以上病例信息通過“雙錄入”“雙核對”的方式進行。該研究已進行臨床試驗注冊(注冊號: ChiCTR1900026653)并通過了四川大學華西醫院倫理委員會的審批 [批文編號:2019 年審(1180)號]。
1.3 變量與定義
基線因素包括病例的基本信息、術前 1 周內的檢查指標以及手術實施相關因素 3 個部分。其中病例的基本信息包括性別、年齡、BMI;術前 1 周內檢查指標包括術前總膽紅素、術前血紅蛋白;手術相關指標包括術前減黃情況、ASA 分級、手術時間、手術估計出血量、胰腺質地、血管切除重建情況、胰管直徑等。本研究擬對動態預測 LPD 術后 CR-POPF 模型[8]進行驗證,該研究所涉及的模型相關變量包括:術前 1 周內的血清白蛋白、血肌酐;術后第 2、3 和 5 天的引流液淀粉酶水平;以及這些時間點的 C-反應蛋白與血清白蛋白的比值(C-reactive protein to albumin ratio,CAR)。結局變量是 CR-POPF 的發生與否,根據 ISGPS 定義[9],CR-POPF 包括 B 級和 C 級胰瘺。
1.4 模型驗證
本研究根據動態預測 CR-POPF 模型[8]計算每例患者在術后不同時間點(術后第 2、3 和 5 天)的 CR-POPF 危險預測值,通過逐個時刻(術后第 2、3 和 5 天)的模型預測值界值點預測本隊列整體及 LPD 術中留置主胰管支撐管與否的患者的術后 CR-POPF 之特異度、敏感度和預測準確率評估該模型的預測準確性,并通過繪制該模型預測本隊列及放置/不放置支撐管亞組的 ROC 曲線衡量該模型預測值的區分度,包括 ROC 曲線下面積及其 95% 置信區間,以及根據 ROC 曲線確定的新界值點下的特異度和敏感度。同時,本研究還計算了模型預測值界值點和根據上述通過本隊列繪制的 ROC 曲線下的模型預測值新界值點所確定的 2 個不同預測結論的 Kappa 值[10],以衡量該模型預測結論自身具備的穩定性。
1.5 統計學方法
本研究采用 SPSS v.23.0 (IBM Corp.,Armonk,NY) 進行統計學分析。對連續變量且服從正態分布的計量資料用均數±標準差(±s)表示,并通過成組 t 檢驗分析組間統計學差異;不服從正態分布的計量資料用 M(P25,P75)表示,并通過 Mann-Whitney 檢驗分析組間統計學差異。對有序變量,本研究亦通過 Mann-Whitney 檢驗分析組間統計學差異。對分類變量,本研究采用成組 χ2 檢驗或 Fisher 精確法。檢驗水準 α=0.05(雙側檢驗)。
2 結果
2.1 隊列的基本情況
2.1.1 基線因素
本研究納入動態預測模型的 2 組患者的基線因素具體見表 1。

2.1.2 模型相關因素及 LPD 術后胰瘺發生情況
本研究納入動態預測模型的 2 組患者的模型相關因素以及 LPD 術后胰瘺發生情況具體見表 2。

2.2 動態預測模型的預測能力驗證結果
2.2.1 模型的準確性和區分能力驗證結果
就模型及其對應預測臨界值的準確性而言,動態預測模型對 CR-POPF 的預測,其在術后第 2、3 和 5 天對整體隊列預測的特異度分別為 91.7%、82.8% 和 61.5%,敏感度分別為 33.3%、75.0% 和 75.0%,預測準確率分別為 88.2%、82.3% 和 66.1%。其中在支撐管組,模型對術后第 2、3 和 5 天 CR-POPF 預測的特異度分別為 92.0%、76.7% 和 57.1%,敏感度分別為 50.0%、100% 和 66.7%,預測準確率分別為 88.8%、78.8% 和 61.3%。 而在無支撐管組模型對術后第 2、3 和 5 天 CR-POPF 預測的特異度分別為 91.3%、89.3% 和 66.7%,敏感度分別為 0.0%、0.0% 和 100%,預測準確率分別為 87.5%、86.2% 和 72.0%。
從模型預測值的區分度來看,多數時間點下的 ROC 曲線下面積及其 95% 置信區間 [AUC(95%CI)]提示該模型預測值對本研究整體隊列具有較好至很好的區分性能,其在術后第 2、3 和 5 天分別為 0.674 (0.308,1.000),0.894 (0.772,1.000),和 0.781 (0.596,0.966)。其中術后第 3 天的預測值其曲線下面積最大,可區分性最為明顯。其在術后第 2、3 和 5 天的模型預測值界值點分別為 5.4%、21.9% 及 6.1%,與之對應的特異度和敏感度分別為 72.9%、93.1% 和 57.7% 以及 66.7%、75.0% 和 100%。動態預測模型對術后不同時間點整體隊列 CR-POPF 預測風險值的 ROC 曲線及界值點見圖 1a-1c。

a–c:整體隊列的 ROC 曲線及界值點;d–f:無支撐管組的 ROC 曲線及界值點;g–i:支撐管組的 ROC 曲線及界值點;三角處表示 ROC 曲線上的界值點
在無支撐管組中,各時間點的 AUC 及其 95%CI 提示,除術后第 2 天 [0.304(0.067,0.541)]外,該模型在其他時間點(術后第 3 及 5 天)的區分度較好至很好,術后第 3 天為 0.821(0.659,0.984),術后第 5 天為 0.958(0.878,1.000),其中術后第 5 天的模型預測值可區分性最為明顯。對該組病例,除術后第 2 天外,在模型預測值可區分 LPC 術后 CR-POPF 發生與否的兩時間點(術后第 3 和 5 天),模型預測值的界值點分別為 5.2% 和 36.7%,與之對應的特異度分別為 75% 和 95.8%,敏感度則分別為 100% 和 100%(圖 1d-1f)。
而對于放置支撐管的隊列而言,該模型于術后第 2、3 和 5 天的預測值的 AUC 及其 95%CI 分別為 0.870(0.685,1.000)、0.956(0.885,1.000)和 0.702(0.451,0.953),對應的模型預測值界值點與整體隊列相同,分別為 5.4%、21.9% 及 6.1%。在術后第 2、3 和 5 天,模型預測值界值點預測術后 CR-POPF 發生的特異度分別為 72.0%、93.3% 和 53.6%,敏感度則在各個時刻均為 100% (圖 1g-1i)。
2.2.2 模型預測結論的穩定性驗證結果
對于整體隊列而言,術后第 2、3 和 5 天的動態預測模型界值點和上述 ROC 曲線上界值點的 2 個不同預測結論的 Kappa 值分別為 0.414、0.648 和 0.781。 其中,無支撐管組于術后第 3 和 5 天的不同預測結論的 Kappa 值分別為 0.465 和 0.449(無支撐管組術后第 2 天的模型預測值無法預測 CR-POPF 發生,故其 Kappa 值未計算),而支撐管組逐個時間點的該值分別為 0.308、0.582 和 0.744。
3 討論
本研究結果以小驗證集樣本前瞻性同中心驗證了 CR-POPF 動態預測模型的所具有的外延適用性[11],并由此填補了模型建立過程中所留下的空白[8]。一方面,從模型預測值的區分性上看,本研究的動態預測模型可在多數情況下較好地在整體隊列中篩查出較易發生 LPD 術后 CR-POPF 的病例,其中術后第 3 天的結果尤為準確。另一方面,從整體隊列上看,無論是根據隊列 ROC 曲線確定界值點,還是模型開發過程中按照建模病例所確定的臨界值[8],其界值點基本波動在 5%~20% 之間,前后 2 個不同界值點下的預測結論一致性可以達到良好的水平,由此證實了該模型篩查 CR-POPF 的結果具有一定程度的穩定性。
就模型的以上特性在 LPD 術中是否放置主胰管支撐管的病例中的表現結果上看,該模型更適用于 LPD 術中放置胰管支撐管的人群,表現為相對較高的預測準確性、模型預測值較好的區分能力以及更高的篩查結果穩定性,這是由于筆者所在醫院腹腔鏡微創中心在完成 LPD 的過程中,一般采用常規放胰管支撐管的方式完成胰腸吻合,使得該動態預測 CR-POPF 模型的建模隊列中放置支撐管的病例占據多數,從而在某種意義上講,該模型在 LPD 術中未放置胰腺支撐管的隊列中進行的驗證屬于一種“外部驗證” 。即便如此,該模型在不放置胰腺支撐管組中的驗證表現亦凸顯出其在術后第 5 天的篩查價值和預測結果的穩定性(術后第 3 天可以>36.7% 的預測值預測 CR-POPF 的發生),相比于僅依據引流液淀粉酶水平在術后第 3 天確定為臨床意義較低的生化漏[9],此時該模型對 CR-POPF 發生的預測結論可以更好地選擇患者進行 CR-POPF 發生的管理、檢測和預防。
關于 LPD 術后 CR-POPF 的預測,目前文獻的報道多以多因素靜態模型為主,如 FRS 評分、a-FRS 以及 ua-FRS 系統,以及女性、高齡、軟胰、主胰管直徑細小等胰瘺高危因素均被納入其中[12-15]。事實上,與 CR-POPF 發生相關的因素可達 10 余種,包括主要和次要的影響因素[16-18],其中低血清白蛋白、腎功能損傷、術后引流液淀粉酶升高、術后強烈的全身炎癥反應等,均已被證實為 LPD 術后 CR-POPF 的強相關因素[19-20]。然而由于群體抽樣導致的樣本具有的變異性,多個影響較小的因素在不同的報道中出現不同的結論。本研究所涉及到的動態預測 CR-POPF 模型使用了上述強相關因素[8],通過在不同時間點做 4 道快速選擇題的方式,提供隨時可以調整的預測結果[21-22],從而便于我們對不同危險度分級的患者進行胰瘺管理,如生長抑素、帕瑞肽、氫化可的松、和“三藥聯用”(加貝脂+奧曲肽+碳青霉烯類抗生素)等[22-25],從而更大程度上減少高危人群發生 CR-POPF 的可能。
盡管 CR-POPF 的發生率較前有降低,且術后第 1 和 2 天的指標的區分度在不同的模型和不同的報道中因指標波動變化的時間窗變異而有所爭議[26-29],但適度調整界值點后,該模型較高的敏感度仍然決定了其具有對 LPD 術后 CR-POPF 高風險病例的篩查功能,并根據指標對應的情況采取不同的胰瘺管理措施。 從綜合預測能力的不同方面來看,術后第 3 天的預測結果更具有臨床上的判別意義。畢竟,無論是 LPD 術中放置胰管支撐管與否,其術后第 3 天的高區分度和高穩定性亦使得該時間點不僅成為了生化漏的診斷時間[9],而且結合模型其他標準,亦成為了 CR-POPF 發生與否的分水嶺。此外,由于 CR-POPF 發生的時間往往發生在 LPD 術后第 5 天以后[9],該時間點較好的模型預測價值亦使得在該時間點指標的變化和模型預測結果的變化成為了一個較好的調整臨床干預措施的依據。對于模型外的因素,由于它對 LPD 術后 CR-POPF 的影響亦不可完全忽略不計[15],臨床上使用該模型的過程中,亦要考慮到病例在其他因素上所具備的情況。
本研究存在一定的局限如下:首先,本研究的隊列樣本量偏少,以至于在此基礎上區分亞組后,未放置支撐管亞組的個別驗證過程未能得出有效結果; 其二,相對于大部分相關研究[1-3]的報道結果,本研究隊列的 CR-POPF 發生率更低,盡管這個因素影響到了結果的效度,但低的 LPD 術后 CR-POPF 發生率亦歸功于筆者所在中心術后胰瘺管理在近年來的提高;另外,盡管本研究實施僅局限于筆者所在中心的 RCT 隊列,但該研究的結果填補了原始模型缺乏驗證集的空白,并證實了該預測模型的臨床可用性。
綜上所述,CR-POPF 動態模型整體上更適用于筆者所在醫院 LPD 術中置胰管支撐管的患者,在該類人群中可更準確地篩查 CR-POPF 高危人群,其篩查結果穩定性較好。在術后第 3 和 5 天,若靈活調整預測值的界值點,該模型亦可對 LPD 術中未放置胰管支撐管的患者進行術后 CR-POPF發生的預測。故對于依照該預測模型被界定為紅框范圍以內的病例,需要采取預防 CR-POPF 發生之措施,紅框范圍附近的,需要綜合考慮 CR-POPF 發生的其他危險因素。該模型通過了筆者所在醫院的前瞻性試驗的驗證,但需要外院更多的 LPD 病例進行前瞻性驗證。
重要聲明
利益沖突聲明:本文所有作者聲明不存在與本研究相關的利益沖突關系。
作者貢獻聲明: SHASHI Shah 和彭兵是本研究的實驗設計和實驗研究的執行人和負責人;蔡合和 SHASHI Shah 收集和校對本研究涉及的臨床數據;劉潤文完成本文的數據及試驗結果分析以及本文的撰寫;蔡合和彭兵負責修改論文。全體作者都閱讀并同意最終的文本。
倫理聲明:本研究已通過四川大學華西醫院生物醫學倫理審查委員會的審批 [批文編號:2019 年審(1180)號]。