引用本文: 陳晨陽, 王齊艷, 吳明蓬, 陳婕, 黃子星, 宋彬. 新亞特蘭大分類下不同CT評分標準早期預測急性胰腺炎器官衰竭的價值比較. 中國普外基礎與臨床雜志, 2015, 22(1): 117-120. doi: 10.7507/1007-9424.20150032 復制
急性胰腺炎(acute panceatics,AP)是一種動態進展的疾病,由兩個部分重疊的時期組成:早期和晚期[1]。早期階段病程常持續1周,晚期病程則可延續數周甚至數月。AP的嚴重程度劃分為3個等級:輕癥急性胰腺炎(mild acute pancreatitis,MAP)、中重癥急性胰腺炎(moderately severe acute pancreatitis,MSAP)和重癥急性胰腺炎(severe acute pancreatitis,SAP)。早期階段MSAP和SAP的診斷是基于器官功能衰竭的出現及持續時間,所以在疾病早期預測器官衰竭出現與否是評價AP嚴重程度的關鍵。
近年來,多種研究[2-4]認為,臨床評分系統和CT評分系統對AP的嚴重程度評估有良好的準確性;增強CT(contrast-enhanced CT,CECT)作為AP影像學檢查參照標準,也有學者[5]認為其對早期AP的診斷和臨床處理沒有顯著影響。2012年亞特蘭大AP分類共識[6]也認為,在發病第1周進行CECT檢查意義不大[7]。現臨床相對常用的AP嚴重程度影像評分系統是CT嚴重指數(CT severity index,CTSI),近年又出現了一些新的影像評分系統,如修正CT嚴重指數(modified CT severity index, MCTSI)、胰腺外炎癥評分(extrapancreatic inflammation on CT,EPIC)。本研究回顧性分析了筆者所在醫院2013年12月至2014年1月期間因AP入院治療,并于早期進行了CT檢查的54例患者的臨床資料,旨在探討早期CT評分與AP器官衰竭的關系,同時比較了各影像評分系統對AP器官衰竭的診斷作用的大小。
1 資料與方法
1.1 研究對象
收集筆者所在醫院2013年12月至2014年1月期間因AP入院治療、臨床資料齊全并在首次腹痛7 d內入院治療的患者54例,男34例,女20例;平均年齡50.4歲(16~83歲)。慢性胰腺炎、妊娠AP、腫瘤性胰腺炎、創傷性胰腺炎和慢性胰腺炎急性發作患者排除在外。乙醇性AP有4例,膽源性AP 6例,病因不明確44例。轉入ICU 5例,行手術治療2例;平均住院時間13.5 d(3~58 d)。無死亡患者。
1.2 數據收集
收集患者入院24及48 h的臨床數據和實驗室數據,計算患者AP嚴重程度床邊指數(beside index of severity in acute pancreatitis, BISAP)[8]及新日本胰腺炎嚴重程度評分(new Japanese severity score,NJSS)[9]。所有患者的CT圖片由兩名具有3年以上工作經驗的放射科診斷醫師在不知道臨床評分結果的前提下獨立審片,若診斷結果出現分歧,則請更高年資的放射科診斷醫師進行判定。根據審片結果計算每例患者的CTSI [10]、MCTSI [11]及EPIC [12]。
1.3 新亞特蘭大標準中AP的相關定義
AP的診斷需至少符合以下3項中的2項:①具有AP特征的腹痛(急性、持續、劇烈的上腹部疼痛并常向背部放射);②血清脂肪酶活性(或淀粉酶活性)至少大于正常值上限的3倍;③CECT、磁共振(magnetic resonance imaging, MRI)或腹部超聲檢查發現有AP的特征性改變。局部并發癥包括:急性胰周液體積聚、胰腺假性囊腫、急性壞死積聚和包裹性壞死。器官衰竭根據修改的Marshall器官衰竭評分系統判定(表 1)[6],任何系統評分≥2即定義為器官衰竭。

1.4 統計學方法
用SPSS 19.0統計軟件進行統計學分析。患者的基線資料進行獨立樣本Mann-Whitney U檢驗。繪制各個評分系統的受試者特征曲線(receiver operating characteristic,ROC),計算曲線下面積(the area under the curve,AUC)、最高約登指數、獲得閾值、敏感度、特異度、陰性似然比(negative likelihood ratio,-LR)、陽性似然比(positive likelihood ratio,+LR)及診斷比值比(diagnostic odd ratio,OR)。檢驗水準α=0.05。
2 結果
2.1 患者基線及器官衰竭情況比較結果
54例患者中22例出現局部并發癥。根據器官衰竭情況將患者分為2組,早期發生器官衰竭組16例,未發生器官衰竭組38例。2組患者的年齡、性別、首次腹痛至入院間隔時間、BISAP以及NJSS之間差異均無統計學意義(P > 0.05)。2組患者的CTSI、MCTSI、EPIC、局部并發癥及住院時間之間的差異均有統計學意義(P < 0.05)。見表 2。

2.2 各評分系統預測AP患者早期發生器官衰竭的ROC
各評分系統預測AP患者早期發生器官衰竭的ROC見圖 1,根據ROC計算的AUC見表 3。由表 3可見,影像評分系統的CTSI、MCTSI和EPIC預測AP早期發生器官衰竭具有統計學意義(P < 0.05),并且對預測早期器官衰竭有較高的準確性(AUC > 0.7);局部并發癥預測器官衰竭也有統計學意義(P < 0.05),但準確性較低(AUC=0.5~0.7)。臨床評分系統的BISAP和NJSS預測AP早期發生器官衰竭無統計學意義(P > 0.05)。所有評分標準中,EPIC的AUC最高,為0.89(95%置信區間為0.81~0.98),CTSI和MCTSI相差不大,分別為0.75(95%置信區間為0.61~0.89)和0.77(95%置信區間為0.64~0.90)。


2.3 各評分系統預測AP早期器官衰竭的效能比較
結果見表 4。由表 4可見,EIPC預測AP早期器官衰竭的敏感度最高;4個評分系統的特異度相差不大。EPIC的-LR最低,+LR最高,OR最高;其余評分系統的敏感度、特異度、-LR、+LR和OR都相差不大。

3 討論
AP的發病率逐年升高,病死率仍居高不下。臨床上,大多數患者的病程呈自限性,20%~30%患者臨床經過兇險,總體病死率為5%~10%[13],SAP病死率更高,為36%~50%,后期如果合并感染,則病死率極高[14]。因此,在早期預測患者病情的嚴重程度尤為重要。
有很多類似研究,只比較CT評分系統[15],或是比較單個CT評分系統與多個臨床評分系統[16]。本研究探討AP早期階段的多個CT評分系統與2個臨床評分系統預測AP早期器官衰竭的價值。研究結果表明,影像學評分系統預測早期器官衰竭具有統計學意義,臨床評分系統無統計學意義,且前者有較好的診斷效能。
胰腺外炎癥評分(EPIC)是2007年De Waele等[12]設計出用于早期預測AP嚴重程度的新的CT評分系統,其評分指標包括胸水、腹水、腹膜后間隙炎癥以及腸系膜腫脹情況,前3項各自最高值為2分,最后一項最高值為1分,理論EPIC最高值為7分。隨后有學者[17]的研究證實了EPIC的良好預測能力。國內李崢艷等[18]研究認為,EPIC評分能較好地預測急性腎功能損害。本研究結果與上述研究結果吻合,EPIC預測早期器官衰竭的準確性、敏感度及診斷OR明顯高于CTSI、MCTSI和局部并發癥,即如果由EPIC診斷為陽性,相對于CTSI和MCTSI診斷為陽性,患者發生器官衰竭的可能性高。
本研究關于臨床評分系統與諸多研究存在分歧。這些研究[16, 19-22]表明,對于早期AP患者,BISAP評分預測疾病嚴重程度具有統計學意義,且準確性較好。考慮原因有以下2點:①由于某些限制,陰性結果的研究可能發表得較少,或是不予提及;②也有可能是本研究樣本量不夠,存在較大統計學的誤差。另有研究[23-25]表明,NJSS預測AP器官衰竭及病死率的效果好,這與本研究相矛盾。原因可能是NJSS在預測危重AP方面比較突出,如病死率、ICU入住率、手術風險等方面,而本研究患者群體中發生死亡、入住ICU及手術治療例數很少,故NJSS的作用不能體現。
本研究屬于回顧性病例分析,在數據收集上存在不可彌補的缺陷。首先,研究的群體存在偏倚,臨床部分癥狀較輕的患者也許并不選擇入院治療,不在7 d內進行CT檢查,或者實驗室檢查完成得不全面,使得納入研究的患者構成比例并不符合正常流行病學情況。其次,本研究納入的患者例數較少,只有54例。最后,并不是所有患者都進行了增強CT檢查,并且檢查的機器型號也不盡相同,這會使放射科醫師在診斷時可能產生測量性偏倚。
本研究發現,EPIC是早期預測AP患者器官衰竭的高準確性、高敏感度、高特異度、且方便計算的評分系統,有助于臨床在早期預測是否發生器官衰竭,并可以指導治療方案的選擇。
急性胰腺炎(acute panceatics,AP)是一種動態進展的疾病,由兩個部分重疊的時期組成:早期和晚期[1]。早期階段病程常持續1周,晚期病程則可延續數周甚至數月。AP的嚴重程度劃分為3個等級:輕癥急性胰腺炎(mild acute pancreatitis,MAP)、中重癥急性胰腺炎(moderately severe acute pancreatitis,MSAP)和重癥急性胰腺炎(severe acute pancreatitis,SAP)。早期階段MSAP和SAP的診斷是基于器官功能衰竭的出現及持續時間,所以在疾病早期預測器官衰竭出現與否是評價AP嚴重程度的關鍵。
近年來,多種研究[2-4]認為,臨床評分系統和CT評分系統對AP的嚴重程度評估有良好的準確性;增強CT(contrast-enhanced CT,CECT)作為AP影像學檢查參照標準,也有學者[5]認為其對早期AP的診斷和臨床處理沒有顯著影響。2012年亞特蘭大AP分類共識[6]也認為,在發病第1周進行CECT檢查意義不大[7]。現臨床相對常用的AP嚴重程度影像評分系統是CT嚴重指數(CT severity index,CTSI),近年又出現了一些新的影像評分系統,如修正CT嚴重指數(modified CT severity index, MCTSI)、胰腺外炎癥評分(extrapancreatic inflammation on CT,EPIC)。本研究回顧性分析了筆者所在醫院2013年12月至2014年1月期間因AP入院治療,并于早期進行了CT檢查的54例患者的臨床資料,旨在探討早期CT評分與AP器官衰竭的關系,同時比較了各影像評分系統對AP器官衰竭的診斷作用的大小。
1 資料與方法
1.1 研究對象
收集筆者所在醫院2013年12月至2014年1月期間因AP入院治療、臨床資料齊全并在首次腹痛7 d內入院治療的患者54例,男34例,女20例;平均年齡50.4歲(16~83歲)。慢性胰腺炎、妊娠AP、腫瘤性胰腺炎、創傷性胰腺炎和慢性胰腺炎急性發作患者排除在外。乙醇性AP有4例,膽源性AP 6例,病因不明確44例。轉入ICU 5例,行手術治療2例;平均住院時間13.5 d(3~58 d)。無死亡患者。
1.2 數據收集
收集患者入院24及48 h的臨床數據和實驗室數據,計算患者AP嚴重程度床邊指數(beside index of severity in acute pancreatitis, BISAP)[8]及新日本胰腺炎嚴重程度評分(new Japanese severity score,NJSS)[9]。所有患者的CT圖片由兩名具有3年以上工作經驗的放射科診斷醫師在不知道臨床評分結果的前提下獨立審片,若診斷結果出現分歧,則請更高年資的放射科診斷醫師進行判定。根據審片結果計算每例患者的CTSI [10]、MCTSI [11]及EPIC [12]。
1.3 新亞特蘭大標準中AP的相關定義
AP的診斷需至少符合以下3項中的2項:①具有AP特征的腹痛(急性、持續、劇烈的上腹部疼痛并常向背部放射);②血清脂肪酶活性(或淀粉酶活性)至少大于正常值上限的3倍;③CECT、磁共振(magnetic resonance imaging, MRI)或腹部超聲檢查發現有AP的特征性改變。局部并發癥包括:急性胰周液體積聚、胰腺假性囊腫、急性壞死積聚和包裹性壞死。器官衰竭根據修改的Marshall器官衰竭評分系統判定(表 1)[6],任何系統評分≥2即定義為器官衰竭。

1.4 統計學方法
用SPSS 19.0統計軟件進行統計學分析。患者的基線資料進行獨立樣本Mann-Whitney U檢驗。繪制各個評分系統的受試者特征曲線(receiver operating characteristic,ROC),計算曲線下面積(the area under the curve,AUC)、最高約登指數、獲得閾值、敏感度、特異度、陰性似然比(negative likelihood ratio,-LR)、陽性似然比(positive likelihood ratio,+LR)及診斷比值比(diagnostic odd ratio,OR)。檢驗水準α=0.05。
2 結果
2.1 患者基線及器官衰竭情況比較結果
54例患者中22例出現局部并發癥。根據器官衰竭情況將患者分為2組,早期發生器官衰竭組16例,未發生器官衰竭組38例。2組患者的年齡、性別、首次腹痛至入院間隔時間、BISAP以及NJSS之間差異均無統計學意義(P > 0.05)。2組患者的CTSI、MCTSI、EPIC、局部并發癥及住院時間之間的差異均有統計學意義(P < 0.05)。見表 2。

2.2 各評分系統預測AP患者早期發生器官衰竭的ROC
各評分系統預測AP患者早期發生器官衰竭的ROC見圖 1,根據ROC計算的AUC見表 3。由表 3可見,影像評分系統的CTSI、MCTSI和EPIC預測AP早期發生器官衰竭具有統計學意義(P < 0.05),并且對預測早期器官衰竭有較高的準確性(AUC > 0.7);局部并發癥預測器官衰竭也有統計學意義(P < 0.05),但準確性較低(AUC=0.5~0.7)。臨床評分系統的BISAP和NJSS預測AP早期發生器官衰竭無統計學意義(P > 0.05)。所有評分標準中,EPIC的AUC最高,為0.89(95%置信區間為0.81~0.98),CTSI和MCTSI相差不大,分別為0.75(95%置信區間為0.61~0.89)和0.77(95%置信區間為0.64~0.90)。


2.3 各評分系統預測AP早期器官衰竭的效能比較
結果見表 4。由表 4可見,EIPC預測AP早期器官衰竭的敏感度最高;4個評分系統的特異度相差不大。EPIC的-LR最低,+LR最高,OR最高;其余評分系統的敏感度、特異度、-LR、+LR和OR都相差不大。

3 討論
AP的發病率逐年升高,病死率仍居高不下。臨床上,大多數患者的病程呈自限性,20%~30%患者臨床經過兇險,總體病死率為5%~10%[13],SAP病死率更高,為36%~50%,后期如果合并感染,則病死率極高[14]。因此,在早期預測患者病情的嚴重程度尤為重要。
有很多類似研究,只比較CT評分系統[15],或是比較單個CT評分系統與多個臨床評分系統[16]。本研究探討AP早期階段的多個CT評分系統與2個臨床評分系統預測AP早期器官衰竭的價值。研究結果表明,影像學評分系統預測早期器官衰竭具有統計學意義,臨床評分系統無統計學意義,且前者有較好的診斷效能。
胰腺外炎癥評分(EPIC)是2007年De Waele等[12]設計出用于早期預測AP嚴重程度的新的CT評分系統,其評分指標包括胸水、腹水、腹膜后間隙炎癥以及腸系膜腫脹情況,前3項各自最高值為2分,最后一項最高值為1分,理論EPIC最高值為7分。隨后有學者[17]的研究證實了EPIC的良好預測能力。國內李崢艷等[18]研究認為,EPIC評分能較好地預測急性腎功能損害。本研究結果與上述研究結果吻合,EPIC預測早期器官衰竭的準確性、敏感度及診斷OR明顯高于CTSI、MCTSI和局部并發癥,即如果由EPIC診斷為陽性,相對于CTSI和MCTSI診斷為陽性,患者發生器官衰竭的可能性高。
本研究關于臨床評分系統與諸多研究存在分歧。這些研究[16, 19-22]表明,對于早期AP患者,BISAP評分預測疾病嚴重程度具有統計學意義,且準確性較好。考慮原因有以下2點:①由于某些限制,陰性結果的研究可能發表得較少,或是不予提及;②也有可能是本研究樣本量不夠,存在較大統計學的誤差。另有研究[23-25]表明,NJSS預測AP器官衰竭及病死率的效果好,這與本研究相矛盾。原因可能是NJSS在預測危重AP方面比較突出,如病死率、ICU入住率、手術風險等方面,而本研究患者群體中發生死亡、入住ICU及手術治療例數很少,故NJSS的作用不能體現。
本研究屬于回顧性病例分析,在數據收集上存在不可彌補的缺陷。首先,研究的群體存在偏倚,臨床部分癥狀較輕的患者也許并不選擇入院治療,不在7 d內進行CT檢查,或者實驗室檢查完成得不全面,使得納入研究的患者構成比例并不符合正常流行病學情況。其次,本研究納入的患者例數較少,只有54例。最后,并不是所有患者都進行了增強CT檢查,并且檢查的機器型號也不盡相同,這會使放射科醫師在診斷時可能產生測量性偏倚。
本研究發現,EPIC是早期預測AP患者器官衰竭的高準確性、高敏感度、高特異度、且方便計算的評分系統,有助于臨床在早期預測是否發生器官衰竭,并可以指導治療方案的選擇。