引用本文: 李崢艷, 汪曉東, 黃子星, 宋彬. 影像組學在局部進展期直腸癌新輔助放化療中的預測價值. 中國普外基礎與臨床雜志, 2020, 27(8): 1016-1022. doi: 10.7507/1007-9424.202006028 復制
結直腸癌是消化系統最為常見的惡性腫瘤之一,據 2018 年全球統計,結直腸癌的發病率位居第 3,腫瘤相關死亡率排名第 2,5 年生存率約 65%[1]。根據中國近期的研究統計,結直腸癌的發病率與死亡率分別位于第五位與第四位,且結直腸癌的發病率在逐年上升[2]。在結直腸癌中,直腸癌的發病率略高于結腸癌,治療方案也更為復雜。外科手術切除仍然是直腸癌最為重要的治療手段,但對于局部進展期直腸癌(locally advanced rectal cancer,LARC)而言,單純手術干預腫瘤常不能完全切除,且易導致局部復發。因此,術前新輔助放化療(neoadjuvant chemoradiotherapy,NCRT)聯合全直腸系膜切除術(total mesorectal excision,TME)已經被推薦為 LARC 的常規治療手段[3-4]。然而,據研究發現,仍然有 7%~37% 的 LARC 患者對 NCRT 無療效反應[5-8],而且 NCRT 會增加患者的放化療不良反應及經濟負擔,還延遲了患者的手術干預時機。更為重要的是,相對于 NCRT 反應較好的患者,對 NCRT 無療效反應患者的預后差,遠期轉移率及局部復發率均顯著升高[9]。因此,如何篩選出對 NCRT 有療效反應的 LARC 患者顯得至關重要。目前的影像學診斷技術,例如增強 CT、磁共振顯像技術(MRI)、正電子發射計算機斷層顯像技術(PET-CT)等,也用于預測 LARC 患者對 NCRT 的反應性,但效果及應用均有限[10-13]。
影像組學(radiomics)于 2012 年由荷蘭學者 Lambin 等[14]率先提出,它是利用計算機軟件從醫學影像資料中自動化抽取海量影像定量特征,再基于機器學習或統計學方法,篩選出關鍵的影像組學特征,構建模型,用于腫瘤的定性、分級分期、基因分析、療效評估、預后預測等,在輔助臨床決策方面具有重要作用[15-18]。而且近期研究發現,影像組學在預測 LARC 患者對 NCRT 的反應性方面發揮著重要作用[19-23],筆者將對此作一綜述。
1 影像組學技術組成
影像組學技術的工作流程常由 5 部分組成[24]:① 數據選擇與分析;② 成像標準化與分割;③ 特征提取與選擇;④ 預測模型與數據庫建立;⑤ 質量評估與分類預測。
1.1 數據選擇與分析
該步驟是影像組學工作流程的基礎,首先根據需要解決的臨床問題選擇影像的感興趣區域(region of interest,ROI),用于預測或評估重要的臨床事件。ROI 可選擇目標腫瘤區域、轉移性病變或者有關聯的正常組織。影像圖像的來源可選擇任何可獲取高質量標準化圖像的方法,例如 CT、MRI、PET-CT、超聲等,后期可通過建立影像數據庫,對相關的海量數據進行儲存并形成信息化網絡,以便進行統計與分析[24-25]。
1.2 成像標準化與分割
根據臨床問題確定影像學方法和 ROI 后,由于不同型號的機器設備或者設備的不同參數,應盡可能對原始圖像進行統一的標準化處理,最大限度地避免數據偏差。圖像標準化預處理的方法包括圖像配準、降噪、圖像不均勻性校正、偏場校正等,但是目前對圖像標準化預處理方法的選擇還沒有一個統一的標準。圖像分割(image segmentation)一般分為手工分割、半自動分割及自動分割 3 種方式,是通過獲取的標準化圖像進行 ROI 提取的過程。臨床應用中常將腫瘤區域與其他組織進行圖像分割,以便于下一步腫瘤特征的處理。手工分割是目前應用最為廣泛的分割方法,但由于腫瘤形態的不規則性及異質性,對特定腫瘤的精確分割面臨挑戰,常存在耗時較長、可重復性差、不同醫師分割區域的異質性大等問題。多重方式分割(multi-segmentation)[26]是一種可盡量避免偏倚的方法,可采用多位不同的醫生對圖像進行分割、通過不同分割算法或者通過不同的呼吸周期進行多次分割等方法,最為關鍵的是還可以觀察不同醫生和不同方法之間的異質性。半自動分割與自動分割具有簡便快捷、重復性好等多方面優勢,但目前臨床應用尚存在一定局限性[27]。半自動分割可通過分割軟件進行人機交互的形式進行圖像分割,分割速度比人工方式明顯提高,但該法在自動識別腫瘤邊界時準確性受到影響,而且分割結果仍受限于操作者的經驗。自動分割是今后影像組學圖像分割的趨勢,極大地降低了研究者的工作負擔,而且重復性最佳,目前尚處于探索階段[28]。
目前應用最為廣泛的圖像分割算法(segmentation algorithms)是基于閾值的分割方法,特別是對于信噪比高的影像圖片有較好的分割效果[29]。除此之外,還有基于邊緣的分割方法以及基于區域的分割方法,各有利弊。近些年來在上述基礎分割方法的基礎上,特別是在腫瘤區域 ROI 標定中,創新出了新的分割方法,包括滑降區域生長法、半自動分割算法、統計模式識別分割法、小波變換邊緣檢測分割法、基于容量 CT 的分割法等[30-33]。
1.3 特征提取與選擇
圖像特征提取是影像組學的關鍵部分,通過分割算法將 ROI 分割完成后,即可提取 ROI 內的高維度特征數據,并定量描述該特征的屬性,常用來描述腫瘤強度特征、形狀特征、紋理特征、小波特征等[28, 34]。醫學圖像涉及的人體組織器官具有結構復雜性、噪聲顯著性、數據海量性等特點,醫學圖像的特征提取常存在難度,因此,常需要篩選出與目標結果緊密關聯的相關特征并刪除不穩定的其他特征,以期得到最為恰當而合理的描述,而且在圖像發生移動、旋轉、縮放等幾何變化時上述特征維持不變。在臨床實施過程中,常采用機器訓練學習或者特定統計學方法來實現,例如 LASSO(least absolute shrinkage and selection operator)回歸、主成分分析法(principal component analysis,PCA)、遞歸特征消除(recursive feature elimination,RFE)、最大相關最小冗余(maximum relevance and minimum redundancy,mRMR)等[35-37]。
1.4 預測模型與數據庫建立
該步驟首先通過獲取的相關聯的影像組學特征,通過恰當的統計學方法建立臨床所需的預測模型。此外,影像組學僅是影像中的一部分數據信息,臨床應用過程中影像組學特征常需要與目標相關的其他數據特征(基因信息、免疫組織化學標志物、臨床相關特征等)相結合,為預測或評估預后提供更為準確的信息[8, 38-40]。常用的模型包括支持向量機(support vector machine,SVM)、隨機森林(random forest)、logistic 回歸、用于生存分析的 Cox 比例風險模型等[24-25]。不同的模型建立方法可能存在局限性,實際應用中可嘗試不同的模型建立方法,比較并選擇最優的預測模型。同時應強調的是,臨床有價值的影像組學特征一般不會受到預測模型本身的影響,均能產生比較有價值的結果。
此外,在大數據時代,基于計算機技術,將影像的圖片轉換成可分析統計的量化數據并建立影像組學數據庫是影像組學發展的重要工作。通過建立全國多中心、標準化的影像組學數據庫,打破生物醫學數據庫之間的信息壁壘,是最終將影像組學應用于臨床的重要保證[28, 41]。
1.5 質量評估與分類預測
通過影像組學建立的分類預測模型必須進行標準化的質量評估,可先進行內部驗證,然后進行外部驗證(例如多中心臨床驗證),最后再用于臨床決策[42]。Hosmer-Lemeshow 檢驗是驗證預測模型的常用檢驗方式,P 值大于 0.05 代表模型表現良好。分類和預測是通過影像組學模型最終實現的結果,常將獲取的數據分為訓練組與驗證組,通過訓練組的影像組學數據分析,建立分類或者預測模型,再通過驗證組評估該模型對未知樣本的分類或預測能力。良好的分類預測模型應對訓練組與驗證組均具有較高的準確性[25, 37, 41]。
2 影像組學在 LARC 行 NCRT 中的預測價值
術前的 NCRT 已經被推薦為 LARC 的常規治療手段[3-4],目前常用腫瘤退縮分級(tumor regre-ssion grading,TRG)的評級標準評價 NCRT 對 LARC 患者的療效[43]:0 級,病理組織中無癌細胞殘留;1 級,病理組織中單個或者小簇癌細胞殘留;2 級,病理組織中仍有殘留癌灶伴有間質纖維化;3 級,病理組織中僅少數或者未見癌細胞消退。通常將 TRG 0 級認為達到病理完全緩解(pathologic complete response,pCR);TRG 0~2 級認為治療有效;TRG 3 級認為 NCRT 治療無效。
既往研究[44-46]指出,傳統影像學特征在預測 LARC 患者對 NCRT 的反應療效方面發揮著重要作用。MRI 的直腸壁外靜脈浸潤(extramural venous invasion,EMVI)征象具有良好的預測價值[44-45]。然而,近期研究發現,EMVI 作為傳統影像學征象仍存在不足,其預測 LARC 對 NCRT 有效性的敏感性及特異性均有限[46-47],具體如下:① 由于 MRI 分辨率和掃描層厚度原因導致小血管的顯示較差,因此 EMVI 的檢查結果可能為假陰性;② 部分 LARC 患者由于伴有高度靜脈侵犯或血管壁及細胞結構的廣泛破壞,無正常血管結構,MRI 也提示 EMVI 陽性,因此可能增加病理診斷的假陰性率。因此,需要一個比傳統影像征象更為準確的影像組學來預測新輔助化療對 LARC 的療效。
2.1 影像組學對 NCRT pCR 率的預測價值
據研究統計,15%~27% 的患者在 NCRT 治療后可達到 pCR[48-49],這部分患者通過長期隨訪發現并不需要再進行手術干預[50-51]。然而,患者是否達到 pCR 往往通過術后的病理結果得知,在術前并不知曉,因此即使獲得 pCR 的患者事實上仍然接受了手術干預。近期有較多研究[20, 22-23]發現,通過術前影像組學技術可協助臨床醫師在術前預測患者在 NCRT 后能否獲得 pCR,從而避免過度治療及手術帶來的負擔及痛苦。
2016 年 Nie 等[22]首次報道了采用 MRI 影像組學對 LARC 患者進行 NCRT 后的 pCR 情況的預測效果。該研究[22]回顧性分析了 48 例進行了 TME 手術干預的 LARC 患者,在治療前 MRI 的 T1WI、T2WI、彌散加權成像(DWI)及動態增強成像(DCE)中提取了 103 個影像組學特征,然后應用人工神經網絡進行分類。受試者工作特征曲線(ROC)分析得出,曲線下面積(AUC)可達 0.71~0.79;而且可以通過整合和優化所有的影像組學特征,最后 AUC 可達到 0.84。2017 年孫應實教授團隊對此領域進行了更為深入的研究[20],納入了共 222 例經過臨床病理證實的 LARC 患者,其中 152 例作為訓練模型組,其他 70 例患者作為驗證模型組,約 17% 的患者獲得 pCR。該研究創新性地將 NCRT 治療前后的 MRI(T2WI 和 DWI)均納入分析,對共約 2 252 個影像組學特征進行提取分析,最終選擇出優化的 30 個影像組學特征進行建模,AUC 可高達 0.976,預測 NCRT 治療后達到 pCR 的準確性可高達 94%~96%。因此,NCRT 前后的 MRI 影像組學特征均具有重要意義,通過該影像組學模型制作的影像組學列線圖(nomogram)可有效地應用于臨床預測患者是否達到 pCR,從而避免進一步的手術治療。近期來自美國的學者也得到了相似的結論。Horvat 等[23]回顧性分析了 114 例經臨床病理證實的 LARC 患者,21 例(18%)患者獲得 pCR,采用 NCRT 治療后的 MRI(T2WI 和 DWI)的影像組學模型預測 pCR 的敏感性和特異性分別為 100% 和 91%。
NCRT 治療前與治療后的影像組學特征預測 pCR 的準確性孰優孰劣鮮有報道。2019 年國內研究團隊[52]比較了兩者對 NCRT 后獲得 pCR 的預測價值。該研究納入了 136 例接受了 NCRT 治療的 LARC 患者,所有患者在 NCRT 治療前及治療結束后 3 周均進行了 MRI(T2WI)檢查,通過影像組學(紋理分析)建立預測模型。結果發現,治療前與治療后影像組學預測的敏感性分別是 66% 與 71%,特異性分別是 87% 與 86%;通過聯合治療前后的影像組學模型可將預測的敏感性與特異性提升至 87% 和 92%,再次證實對 pCR 的預測需要結合 NCRT 治療前后的影像組學特征。
當然,影像組學的預測模型也存在一定的局限性,有學者[53]嘗試將 NCRT 治療前的影像組學與傳統影像征象結合后構成聯合預測模型(radiomics nomogram),結果能獲得更好的預測效果(AUC:0.95~0.97)。此外,較多研究發現了一些生物學標志物,如細胞增殖因子 Ki-67、p53 基因、血管內皮細胞生長因子(VEGF)、果蠅 zeste 基因增強子同源物 2(EZH2)等均能預測 NCRT 的治療效果[54-57]。但目前以影像組學聯合生物標志物建立的模型用來預測 NCRT 后的 pCR 的研究甚少,需進一步驗證。
2.2 影像組學對 NCRT 有效性的預測價值
根據上文所述,NCRT 治療后有 15%~27% 的患者獲得 pCR,約 80% 患者在 NCRT 治療后并未獲得 pCR[48-49]。但研究[6, 58]發現,只要對 NCRT 存在反應性,就可以顯著地縮小局部腫瘤病灶并降低腫瘤分期,增加手術完全切除病灶的成功率,從而改善 LARC 患者的預后。因此,通過化療前影像組學預測 LARC 患者對 NCRT 治療的反應性(包括完全及部分病理緩解)同樣具有臨床價值。2016 年 Nie等[22]采用 MRI 影像組學預測 pCR 的同時,也對 LARC 患者行 NCRT 的有效性進行了預測,發現 AUC 可達到 0.87。2017 年來自韓國的研究團隊[21]采用 CT 的影像組學對 NCRT 治療的有效性進行了預測。該研究納入了 95 例經臨床病理學檢查證實的 LARC,術前均接受了 NCRT 治療,通過 CT 的紋理分析,發現沒有過濾的熵、均勻性、峰度、偏度和標準差的影像組學特征在有效與無效 2 組之間均具有顯著性差異,且上述影像組學特征對患者的無瘤生存期(disease-free survival,DFS)的預測也具有重要價值。2018 年 Horvat等[23]也評估了 MRI 影像組學對 NCRT 有效率的預測價值,在納入的 114 例 LARC 患者中,21 例(18%)獲得 pCR,93 例(82%)獲得部分緩解,100% 的患者均有反應性,故作者認為,通過 MRI 的影像組學可以很好地區分完全與部分緩解的患者,但因缺乏對 NCRT 無效的患者,因此未對 NCRT 的總體有效性進行預測。
還有研究[59]通過聯合 MRI 與 PET-CT 的影像組學來預測 NCRT 的療效。該研究[59]回顧性分析了 52 例經 NCRT 治療的 LARC 患者,其中 22 例治療有效。在單一影像組學征象中,單用 MRI 表觀擴散系數(ADC)紋理分析建立的預測模型,預測的敏感性波動在 68% 至 91%,特異性波動在 43% 至 70%;單用 PET-CT 的紋理分析建立的預測模型,敏感性為 63% 至 91%,特異性為 60% 至 83%。該研究[59]通過聯合 MRI 與 PET-CT 的影像組學征象(1 個來源于 MRI,5 個來源于 PET-CT)構建的混合影像組學預測模型,可將敏感性與特異性分別提升至 86% 和 83%。
最近有研究[60]首次采用增強 CT 與 MRI 聯合的影像組學對新輔助化療的反應性進行預測。該研究一共納入了 2016–2019 年期間收入的 118 例 LARC 患者,均接受了新輔助化療與手術治療,其中 80 例患者(68%)治療有效。通過對 396 個 CT/MRI 影像組學特征的篩選,最終 13 個影像組學特征納入分析,其中包括增強 CT 特征 2 個、MRI 高分辨 T2WI 特征 1 個、MRI-ADC 特征 5 個及 MRI-DCE-T1 特征 5 個。在預測能力上,傳統的影像學征象 EMVI 的預測能力欠佳,AUC 波動在 0.578 至 0.73 之間。在影像組學的預測模型中,單用 CT 的影像組學的 AUC 為 0.77 至 0.81,而單用 MRI 影像組學的預測模型中,AUC 為 0.81 至 0.86,如果聯合 CT 與 MRI 的影像組學構建預測模型,AUC 可達到最佳,為 0.91 至 0.92。該研究[60]還將影像組學與臨床特征相結合,構建的多模態臨床-影像組學模型的預測效果得到了進一步提高。
2.3 影像組學對 NCRT 無效的預測價值
通過影像組學預測 LARC 患者進行 NCRT 是否無效同樣具有重要的意義。筆者認為,預測 NCRT 的有效性與無效性解決的是用一個問題,只是側重點不一樣而已。如果通過預測能夠發現 LARC 患者對所用的 NCRT 方案無效,且敏感性與特異性均在 90% 以上,則提示該例患者不能通過該 NCRT 獲益,而且會帶來放化療藥物的不良反應和經濟負擔,甚至可能耽誤手術時機。近期一項國內的大樣本回顧性研究[8]中納入了 425 例經病理學檢查證實的 LARC 患者,其中 248 例患者接受了 5-氟尿嘧啶、甲酰四氫葉酸和奧沙利鉑的新輔助化療方案,另外 177 例患者同時接受 5-氟尿嘧啶與傳統放療方案(總放療劑量 45~50 Gy)。通過 MRI 建立影像組學預測模型,最終篩選出 16 個 MRI 影像組學特征,AUC 值為 0.822 [95%CI 為(0.752,0.891)]。但筆者認為,由于患者使用的新輔助治療的方案存在差異,因此該模型與結論在臨床實施中存在局限性。同期國內的另一項回顧性研究[7]中,共納入 89 例病理學檢查證實的 LARC 患者,均接受了標準 NCRT 治療(放療:45~50.4 Gy,每周 5 次;化療:卡培他濱 825 mg/m2,2 次/d,每周 5 次),66 例患者作為訓練模型組,其他 23 例患者作為驗證模型組,預測對 NCRT 治療無效的準確性。該模型納入了影像組學征象及臨床特異性指標,預測的準確性可高達 91.3%。由此可見,影像組學對 NCRT 無效性的預測具有一定價值。
2.4 影像組學對 NCRT 其他方面的預測價值
影像組學不但對直腸癌 NCRT 療效有預測價值,在治療后腫瘤再分期、術后轉移及預后方面,也有較好的預測價值。近期國內的一項研究[61]共納入了 134 例接受 NCRT 治療的 LARC 患者,采用術前 MRI(T1WI 和 T2WI)的影像組學構建預測模型,不僅能高效地預測 pCR [AUC 為 0.91,95%CI 為(0.83,0.98)] 及治療有效性 [AUC 為 0.90,95%CI 為(0.83,0.97)],還能較好地預測 NCRT 可否使腫瘤分期降級 [AUC 為 0.93,95%CI 為(0.87,0.98)]。術前的準確分期對手術方式及術后的處理都發揮著重要作用。有來自中國的學者[62]結合 NCRT 術前及術后的 MRI 數據,通過收集 ROI 淋巴結的影像組學特征共同建立預測模型,發現能準確預測 LARC 患者的術前分期(AUC 為 0.82),而且明顯優于基于腫瘤本身的影像組學預測模型(AUC:0.82 比 0.69,P=0.037)。近期,亦有國內學者[63]探討基于影像組學的預測模型能否對 LARC 的預后作出準確判斷。在近期一項研究[63]中,納入了 108 例經 NCRT 及 TME 手術干預的患者,按照 1∶1 分為訓練模型組與驗證模型組,發現 MRI 影像組學征象、MRI 傳統 EMVI 征象及腫瘤分期均與患者預后相關。通過建立基于影像組學和臨床特征的混合預測模型能準確預測患者的 3 年 DFS,AUC 為 0.84。此外,術前判斷 LARC 患者是否存在淋巴結轉移及轉移程度也非常重要,會影響外科手術的干預方式(是否行淋巴結清掃及清掃程度)。國內團隊[64]采用增強 CT 的影像組學對 526 例 LARC 患者(326 例為訓練模型組,200 例為驗證模型組)進行預測,通過整合臨床數據及 CT 淋巴結征象獲得混合預測模型,預測 AUC 值達 0.74~0.78。
3 影像組學的局限性
影像組學是影像學發展的新興方向,也是研究學者討論的熱點。如上文所述,在 LARC 患者進行 NCRT 治療時,影像組學可以從多個角度對其完全緩解率、治療有效率、腫瘤分期評估、整體預后等多個方面進行準確預測,在個體化的臨床決策中發揮著重要作用。然而,尚存在一些客觀問題。其一,目前的影像學數據尚缺乏統一的規范及標準,在臨床中使用的常見影像學方法,例如 CT、MRI、超聲、PET-CT 等,采用的機器設備型號、掃描序列、計算方法、圖像參數等可能存在不一致性,可能對提取影像組學特征及預測效能產生影響[26, 65]。因此,在影像組學建立預測模型時需充分考慮相關的混雜因素,并嘗試采用不同的模型建立方法,比較并選擇最優的預測模型。其二,在圖像分割方面,目前是采用 2D 層面圖像還是采用 3D 立體圖像對腫瘤進行紋理分析尚存爭議,而且不同性質的腫瘤部位及不同的 ROI 可能也對不同類型的紋理參數的敏感性不一致,因此將來需要分析 2D 及 3D 圖像的紋理參數對不同腫瘤類型選擇的優劣性。其次,紋理分析在影像組學中扮演著重要角色,但臨床應用中發現,肝臟脂肪含量波動、放化療所導致的腫瘤組織的纖維化程度、原發灶對血流動力學的影響等因素會對紋理參數造成影響[66-67]。此外,統計分析紋理特征采用的不同過濾器也會產生不同的結果,因此亟需制定統一規范的參數采集和恰當的過濾模式,才能真正地用于真實世界的臨床實踐[68]。其三,影像組學的深入研究需要影像醫學與工科計算機技術的密切合作,目前也缺乏醫工交叉學科的復合型人才,數據處理還處于初步階段,并未真正形成能夠廣泛應用于臨床的診斷預測產品。
4 未來展望與小結
隨著人工智能(artificial intelligence,AI)技術的興起及機器學習浪潮的推動,基于 AI 技術的機器深度學習的診斷預測方法是影像組學未來發展的必經之路。在對 LARC 患者 NCRT 療效的評價方面,建立快速、高效且精準的影像組學預測模型應用于臨床,從真正意義上發展成可為臨床所用的輔助預測工具,特別是在目前提倡精準醫療及個性化治療的大背景下,將成為低成本、無創且便捷的新型診斷評估方式。
綜上所述,影像組學是一項新興的影像學診斷技術,在 LARC 行 NCRT 效果的預測中發揮著重要作用,并通過流程化管理可優化治療方案,從而改善患者的短期與長期預后。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:李崢艷查閱文獻、撰寫綜述初稿;汪曉東和黃子星進行修改,宋彬教授校正。
結直腸癌是消化系統最為常見的惡性腫瘤之一,據 2018 年全球統計,結直腸癌的發病率位居第 3,腫瘤相關死亡率排名第 2,5 年生存率約 65%[1]。根據中國近期的研究統計,結直腸癌的發病率與死亡率分別位于第五位與第四位,且結直腸癌的發病率在逐年上升[2]。在結直腸癌中,直腸癌的發病率略高于結腸癌,治療方案也更為復雜。外科手術切除仍然是直腸癌最為重要的治療手段,但對于局部進展期直腸癌(locally advanced rectal cancer,LARC)而言,單純手術干預腫瘤常不能完全切除,且易導致局部復發。因此,術前新輔助放化療(neoadjuvant chemoradiotherapy,NCRT)聯合全直腸系膜切除術(total mesorectal excision,TME)已經被推薦為 LARC 的常規治療手段[3-4]。然而,據研究發現,仍然有 7%~37% 的 LARC 患者對 NCRT 無療效反應[5-8],而且 NCRT 會增加患者的放化療不良反應及經濟負擔,還延遲了患者的手術干預時機。更為重要的是,相對于 NCRT 反應較好的患者,對 NCRT 無療效反應患者的預后差,遠期轉移率及局部復發率均顯著升高[9]。因此,如何篩選出對 NCRT 有療效反應的 LARC 患者顯得至關重要。目前的影像學診斷技術,例如增強 CT、磁共振顯像技術(MRI)、正電子發射計算機斷層顯像技術(PET-CT)等,也用于預測 LARC 患者對 NCRT 的反應性,但效果及應用均有限[10-13]。
影像組學(radiomics)于 2012 年由荷蘭學者 Lambin 等[14]率先提出,它是利用計算機軟件從醫學影像資料中自動化抽取海量影像定量特征,再基于機器學習或統計學方法,篩選出關鍵的影像組學特征,構建模型,用于腫瘤的定性、分級分期、基因分析、療效評估、預后預測等,在輔助臨床決策方面具有重要作用[15-18]。而且近期研究發現,影像組學在預測 LARC 患者對 NCRT 的反應性方面發揮著重要作用[19-23],筆者將對此作一綜述。
1 影像組學技術組成
影像組學技術的工作流程常由 5 部分組成[24]:① 數據選擇與分析;② 成像標準化與分割;③ 特征提取與選擇;④ 預測模型與數據庫建立;⑤ 質量評估與分類預測。
1.1 數據選擇與分析
該步驟是影像組學工作流程的基礎,首先根據需要解決的臨床問題選擇影像的感興趣區域(region of interest,ROI),用于預測或評估重要的臨床事件。ROI 可選擇目標腫瘤區域、轉移性病變或者有關聯的正常組織。影像圖像的來源可選擇任何可獲取高質量標準化圖像的方法,例如 CT、MRI、PET-CT、超聲等,后期可通過建立影像數據庫,對相關的海量數據進行儲存并形成信息化網絡,以便進行統計與分析[24-25]。
1.2 成像標準化與分割
根據臨床問題確定影像學方法和 ROI 后,由于不同型號的機器設備或者設備的不同參數,應盡可能對原始圖像進行統一的標準化處理,最大限度地避免數據偏差。圖像標準化預處理的方法包括圖像配準、降噪、圖像不均勻性校正、偏場校正等,但是目前對圖像標準化預處理方法的選擇還沒有一個統一的標準。圖像分割(image segmentation)一般分為手工分割、半自動分割及自動分割 3 種方式,是通過獲取的標準化圖像進行 ROI 提取的過程。臨床應用中常將腫瘤區域與其他組織進行圖像分割,以便于下一步腫瘤特征的處理。手工分割是目前應用最為廣泛的分割方法,但由于腫瘤形態的不規則性及異質性,對特定腫瘤的精確分割面臨挑戰,常存在耗時較長、可重復性差、不同醫師分割區域的異質性大等問題。多重方式分割(multi-segmentation)[26]是一種可盡量避免偏倚的方法,可采用多位不同的醫生對圖像進行分割、通過不同分割算法或者通過不同的呼吸周期進行多次分割等方法,最為關鍵的是還可以觀察不同醫生和不同方法之間的異質性。半自動分割與自動分割具有簡便快捷、重復性好等多方面優勢,但目前臨床應用尚存在一定局限性[27]。半自動分割可通過分割軟件進行人機交互的形式進行圖像分割,分割速度比人工方式明顯提高,但該法在自動識別腫瘤邊界時準確性受到影響,而且分割結果仍受限于操作者的經驗。自動分割是今后影像組學圖像分割的趨勢,極大地降低了研究者的工作負擔,而且重復性最佳,目前尚處于探索階段[28]。
目前應用最為廣泛的圖像分割算法(segmentation algorithms)是基于閾值的分割方法,特別是對于信噪比高的影像圖片有較好的分割效果[29]。除此之外,還有基于邊緣的分割方法以及基于區域的分割方法,各有利弊。近些年來在上述基礎分割方法的基礎上,特別是在腫瘤區域 ROI 標定中,創新出了新的分割方法,包括滑降區域生長法、半自動分割算法、統計模式識別分割法、小波變換邊緣檢測分割法、基于容量 CT 的分割法等[30-33]。
1.3 特征提取與選擇
圖像特征提取是影像組學的關鍵部分,通過分割算法將 ROI 分割完成后,即可提取 ROI 內的高維度特征數據,并定量描述該特征的屬性,常用來描述腫瘤強度特征、形狀特征、紋理特征、小波特征等[28, 34]。醫學圖像涉及的人體組織器官具有結構復雜性、噪聲顯著性、數據海量性等特點,醫學圖像的特征提取常存在難度,因此,常需要篩選出與目標結果緊密關聯的相關特征并刪除不穩定的其他特征,以期得到最為恰當而合理的描述,而且在圖像發生移動、旋轉、縮放等幾何變化時上述特征維持不變。在臨床實施過程中,常采用機器訓練學習或者特定統計學方法來實現,例如 LASSO(least absolute shrinkage and selection operator)回歸、主成分分析法(principal component analysis,PCA)、遞歸特征消除(recursive feature elimination,RFE)、最大相關最小冗余(maximum relevance and minimum redundancy,mRMR)等[35-37]。
1.4 預測模型與數據庫建立
該步驟首先通過獲取的相關聯的影像組學特征,通過恰當的統計學方法建立臨床所需的預測模型。此外,影像組學僅是影像中的一部分數據信息,臨床應用過程中影像組學特征常需要與目標相關的其他數據特征(基因信息、免疫組織化學標志物、臨床相關特征等)相結合,為預測或評估預后提供更為準確的信息[8, 38-40]。常用的模型包括支持向量機(support vector machine,SVM)、隨機森林(random forest)、logistic 回歸、用于生存分析的 Cox 比例風險模型等[24-25]。不同的模型建立方法可能存在局限性,實際應用中可嘗試不同的模型建立方法,比較并選擇最優的預測模型。同時應強調的是,臨床有價值的影像組學特征一般不會受到預測模型本身的影響,均能產生比較有價值的結果。
此外,在大數據時代,基于計算機技術,將影像的圖片轉換成可分析統計的量化數據并建立影像組學數據庫是影像組學發展的重要工作。通過建立全國多中心、標準化的影像組學數據庫,打破生物醫學數據庫之間的信息壁壘,是最終將影像組學應用于臨床的重要保證[28, 41]。
1.5 質量評估與分類預測
通過影像組學建立的分類預測模型必須進行標準化的質量評估,可先進行內部驗證,然后進行外部驗證(例如多中心臨床驗證),最后再用于臨床決策[42]。Hosmer-Lemeshow 檢驗是驗證預測模型的常用檢驗方式,P 值大于 0.05 代表模型表現良好。分類和預測是通過影像組學模型最終實現的結果,常將獲取的數據分為訓練組與驗證組,通過訓練組的影像組學數據分析,建立分類或者預測模型,再通過驗證組評估該模型對未知樣本的分類或預測能力。良好的分類預測模型應對訓練組與驗證組均具有較高的準確性[25, 37, 41]。
2 影像組學在 LARC 行 NCRT 中的預測價值
術前的 NCRT 已經被推薦為 LARC 的常規治療手段[3-4],目前常用腫瘤退縮分級(tumor regre-ssion grading,TRG)的評級標準評價 NCRT 對 LARC 患者的療效[43]:0 級,病理組織中無癌細胞殘留;1 級,病理組織中單個或者小簇癌細胞殘留;2 級,病理組織中仍有殘留癌灶伴有間質纖維化;3 級,病理組織中僅少數或者未見癌細胞消退。通常將 TRG 0 級認為達到病理完全緩解(pathologic complete response,pCR);TRG 0~2 級認為治療有效;TRG 3 級認為 NCRT 治療無效。
既往研究[44-46]指出,傳統影像學特征在預測 LARC 患者對 NCRT 的反應療效方面發揮著重要作用。MRI 的直腸壁外靜脈浸潤(extramural venous invasion,EMVI)征象具有良好的預測價值[44-45]。然而,近期研究發現,EMVI 作為傳統影像學征象仍存在不足,其預測 LARC 對 NCRT 有效性的敏感性及特異性均有限[46-47],具體如下:① 由于 MRI 分辨率和掃描層厚度原因導致小血管的顯示較差,因此 EMVI 的檢查結果可能為假陰性;② 部分 LARC 患者由于伴有高度靜脈侵犯或血管壁及細胞結構的廣泛破壞,無正常血管結構,MRI 也提示 EMVI 陽性,因此可能增加病理診斷的假陰性率。因此,需要一個比傳統影像征象更為準確的影像組學來預測新輔助化療對 LARC 的療效。
2.1 影像組學對 NCRT pCR 率的預測價值
據研究統計,15%~27% 的患者在 NCRT 治療后可達到 pCR[48-49],這部分患者通過長期隨訪發現并不需要再進行手術干預[50-51]。然而,患者是否達到 pCR 往往通過術后的病理結果得知,在術前并不知曉,因此即使獲得 pCR 的患者事實上仍然接受了手術干預。近期有較多研究[20, 22-23]發現,通過術前影像組學技術可協助臨床醫師在術前預測患者在 NCRT 后能否獲得 pCR,從而避免過度治療及手術帶來的負擔及痛苦。
2016 年 Nie 等[22]首次報道了采用 MRI 影像組學對 LARC 患者進行 NCRT 后的 pCR 情況的預測效果。該研究[22]回顧性分析了 48 例進行了 TME 手術干預的 LARC 患者,在治療前 MRI 的 T1WI、T2WI、彌散加權成像(DWI)及動態增強成像(DCE)中提取了 103 個影像組學特征,然后應用人工神經網絡進行分類。受試者工作特征曲線(ROC)分析得出,曲線下面積(AUC)可達 0.71~0.79;而且可以通過整合和優化所有的影像組學特征,最后 AUC 可達到 0.84。2017 年孫應實教授團隊對此領域進行了更為深入的研究[20],納入了共 222 例經過臨床病理證實的 LARC 患者,其中 152 例作為訓練模型組,其他 70 例患者作為驗證模型組,約 17% 的患者獲得 pCR。該研究創新性地將 NCRT 治療前后的 MRI(T2WI 和 DWI)均納入分析,對共約 2 252 個影像組學特征進行提取分析,最終選擇出優化的 30 個影像組學特征進行建模,AUC 可高達 0.976,預測 NCRT 治療后達到 pCR 的準確性可高達 94%~96%。因此,NCRT 前后的 MRI 影像組學特征均具有重要意義,通過該影像組學模型制作的影像組學列線圖(nomogram)可有效地應用于臨床預測患者是否達到 pCR,從而避免進一步的手術治療。近期來自美國的學者也得到了相似的結論。Horvat 等[23]回顧性分析了 114 例經臨床病理證實的 LARC 患者,21 例(18%)患者獲得 pCR,采用 NCRT 治療后的 MRI(T2WI 和 DWI)的影像組學模型預測 pCR 的敏感性和特異性分別為 100% 和 91%。
NCRT 治療前與治療后的影像組學特征預測 pCR 的準確性孰優孰劣鮮有報道。2019 年國內研究團隊[52]比較了兩者對 NCRT 后獲得 pCR 的預測價值。該研究納入了 136 例接受了 NCRT 治療的 LARC 患者,所有患者在 NCRT 治療前及治療結束后 3 周均進行了 MRI(T2WI)檢查,通過影像組學(紋理分析)建立預測模型。結果發現,治療前與治療后影像組學預測的敏感性分別是 66% 與 71%,特異性分別是 87% 與 86%;通過聯合治療前后的影像組學模型可將預測的敏感性與特異性提升至 87% 和 92%,再次證實對 pCR 的預測需要結合 NCRT 治療前后的影像組學特征。
當然,影像組學的預測模型也存在一定的局限性,有學者[53]嘗試將 NCRT 治療前的影像組學與傳統影像征象結合后構成聯合預測模型(radiomics nomogram),結果能獲得更好的預測效果(AUC:0.95~0.97)。此外,較多研究發現了一些生物學標志物,如細胞增殖因子 Ki-67、p53 基因、血管內皮細胞生長因子(VEGF)、果蠅 zeste 基因增強子同源物 2(EZH2)等均能預測 NCRT 的治療效果[54-57]。但目前以影像組學聯合生物標志物建立的模型用來預測 NCRT 后的 pCR 的研究甚少,需進一步驗證。
2.2 影像組學對 NCRT 有效性的預測價值
根據上文所述,NCRT 治療后有 15%~27% 的患者獲得 pCR,約 80% 患者在 NCRT 治療后并未獲得 pCR[48-49]。但研究[6, 58]發現,只要對 NCRT 存在反應性,就可以顯著地縮小局部腫瘤病灶并降低腫瘤分期,增加手術完全切除病灶的成功率,從而改善 LARC 患者的預后。因此,通過化療前影像組學預測 LARC 患者對 NCRT 治療的反應性(包括完全及部分病理緩解)同樣具有臨床價值。2016 年 Nie等[22]采用 MRI 影像組學預測 pCR 的同時,也對 LARC 患者行 NCRT 的有效性進行了預測,發現 AUC 可達到 0.87。2017 年來自韓國的研究團隊[21]采用 CT 的影像組學對 NCRT 治療的有效性進行了預測。該研究納入了 95 例經臨床病理學檢查證實的 LARC,術前均接受了 NCRT 治療,通過 CT 的紋理分析,發現沒有過濾的熵、均勻性、峰度、偏度和標準差的影像組學特征在有效與無效 2 組之間均具有顯著性差異,且上述影像組學特征對患者的無瘤生存期(disease-free survival,DFS)的預測也具有重要價值。2018 年 Horvat等[23]也評估了 MRI 影像組學對 NCRT 有效率的預測價值,在納入的 114 例 LARC 患者中,21 例(18%)獲得 pCR,93 例(82%)獲得部分緩解,100% 的患者均有反應性,故作者認為,通過 MRI 的影像組學可以很好地區分完全與部分緩解的患者,但因缺乏對 NCRT 無效的患者,因此未對 NCRT 的總體有效性進行預測。
還有研究[59]通過聯合 MRI 與 PET-CT 的影像組學來預測 NCRT 的療效。該研究[59]回顧性分析了 52 例經 NCRT 治療的 LARC 患者,其中 22 例治療有效。在單一影像組學征象中,單用 MRI 表觀擴散系數(ADC)紋理分析建立的預測模型,預測的敏感性波動在 68% 至 91%,特異性波動在 43% 至 70%;單用 PET-CT 的紋理分析建立的預測模型,敏感性為 63% 至 91%,特異性為 60% 至 83%。該研究[59]通過聯合 MRI 與 PET-CT 的影像組學征象(1 個來源于 MRI,5 個來源于 PET-CT)構建的混合影像組學預測模型,可將敏感性與特異性分別提升至 86% 和 83%。
最近有研究[60]首次采用增強 CT 與 MRI 聯合的影像組學對新輔助化療的反應性進行預測。該研究一共納入了 2016–2019 年期間收入的 118 例 LARC 患者,均接受了新輔助化療與手術治療,其中 80 例患者(68%)治療有效。通過對 396 個 CT/MRI 影像組學特征的篩選,最終 13 個影像組學特征納入分析,其中包括增強 CT 特征 2 個、MRI 高分辨 T2WI 特征 1 個、MRI-ADC 特征 5 個及 MRI-DCE-T1 特征 5 個。在預測能力上,傳統的影像學征象 EMVI 的預測能力欠佳,AUC 波動在 0.578 至 0.73 之間。在影像組學的預測模型中,單用 CT 的影像組學的 AUC 為 0.77 至 0.81,而單用 MRI 影像組學的預測模型中,AUC 為 0.81 至 0.86,如果聯合 CT 與 MRI 的影像組學構建預測模型,AUC 可達到最佳,為 0.91 至 0.92。該研究[60]還將影像組學與臨床特征相結合,構建的多模態臨床-影像組學模型的預測效果得到了進一步提高。
2.3 影像組學對 NCRT 無效的預測價值
通過影像組學預測 LARC 患者進行 NCRT 是否無效同樣具有重要的意義。筆者認為,預測 NCRT 的有效性與無效性解決的是用一個問題,只是側重點不一樣而已。如果通過預測能夠發現 LARC 患者對所用的 NCRT 方案無效,且敏感性與特異性均在 90% 以上,則提示該例患者不能通過該 NCRT 獲益,而且會帶來放化療藥物的不良反應和經濟負擔,甚至可能耽誤手術時機。近期一項國內的大樣本回顧性研究[8]中納入了 425 例經病理學檢查證實的 LARC 患者,其中 248 例患者接受了 5-氟尿嘧啶、甲酰四氫葉酸和奧沙利鉑的新輔助化療方案,另外 177 例患者同時接受 5-氟尿嘧啶與傳統放療方案(總放療劑量 45~50 Gy)。通過 MRI 建立影像組學預測模型,最終篩選出 16 個 MRI 影像組學特征,AUC 值為 0.822 [95%CI 為(0.752,0.891)]。但筆者認為,由于患者使用的新輔助治療的方案存在差異,因此該模型與結論在臨床實施中存在局限性。同期國內的另一項回顧性研究[7]中,共納入 89 例病理學檢查證實的 LARC 患者,均接受了標準 NCRT 治療(放療:45~50.4 Gy,每周 5 次;化療:卡培他濱 825 mg/m2,2 次/d,每周 5 次),66 例患者作為訓練模型組,其他 23 例患者作為驗證模型組,預測對 NCRT 治療無效的準確性。該模型納入了影像組學征象及臨床特異性指標,預測的準確性可高達 91.3%。由此可見,影像組學對 NCRT 無效性的預測具有一定價值。
2.4 影像組學對 NCRT 其他方面的預測價值
影像組學不但對直腸癌 NCRT 療效有預測價值,在治療后腫瘤再分期、術后轉移及預后方面,也有較好的預測價值。近期國內的一項研究[61]共納入了 134 例接受 NCRT 治療的 LARC 患者,采用術前 MRI(T1WI 和 T2WI)的影像組學構建預測模型,不僅能高效地預測 pCR [AUC 為 0.91,95%CI 為(0.83,0.98)] 及治療有效性 [AUC 為 0.90,95%CI 為(0.83,0.97)],還能較好地預測 NCRT 可否使腫瘤分期降級 [AUC 為 0.93,95%CI 為(0.87,0.98)]。術前的準確分期對手術方式及術后的處理都發揮著重要作用。有來自中國的學者[62]結合 NCRT 術前及術后的 MRI 數據,通過收集 ROI 淋巴結的影像組學特征共同建立預測模型,發現能準確預測 LARC 患者的術前分期(AUC 為 0.82),而且明顯優于基于腫瘤本身的影像組學預測模型(AUC:0.82 比 0.69,P=0.037)。近期,亦有國內學者[63]探討基于影像組學的預測模型能否對 LARC 的預后作出準確判斷。在近期一項研究[63]中,納入了 108 例經 NCRT 及 TME 手術干預的患者,按照 1∶1 分為訓練模型組與驗證模型組,發現 MRI 影像組學征象、MRI 傳統 EMVI 征象及腫瘤分期均與患者預后相關。通過建立基于影像組學和臨床特征的混合預測模型能準確預測患者的 3 年 DFS,AUC 為 0.84。此外,術前判斷 LARC 患者是否存在淋巴結轉移及轉移程度也非常重要,會影響外科手術的干預方式(是否行淋巴結清掃及清掃程度)。國內團隊[64]采用增強 CT 的影像組學對 526 例 LARC 患者(326 例為訓練模型組,200 例為驗證模型組)進行預測,通過整合臨床數據及 CT 淋巴結征象獲得混合預測模型,預測 AUC 值達 0.74~0.78。
3 影像組學的局限性
影像組學是影像學發展的新興方向,也是研究學者討論的熱點。如上文所述,在 LARC 患者進行 NCRT 治療時,影像組學可以從多個角度對其完全緩解率、治療有效率、腫瘤分期評估、整體預后等多個方面進行準確預測,在個體化的臨床決策中發揮著重要作用。然而,尚存在一些客觀問題。其一,目前的影像學數據尚缺乏統一的規范及標準,在臨床中使用的常見影像學方法,例如 CT、MRI、超聲、PET-CT 等,采用的機器設備型號、掃描序列、計算方法、圖像參數等可能存在不一致性,可能對提取影像組學特征及預測效能產生影響[26, 65]。因此,在影像組學建立預測模型時需充分考慮相關的混雜因素,并嘗試采用不同的模型建立方法,比較并選擇最優的預測模型。其二,在圖像分割方面,目前是采用 2D 層面圖像還是采用 3D 立體圖像對腫瘤進行紋理分析尚存爭議,而且不同性質的腫瘤部位及不同的 ROI 可能也對不同類型的紋理參數的敏感性不一致,因此將來需要分析 2D 及 3D 圖像的紋理參數對不同腫瘤類型選擇的優劣性。其次,紋理分析在影像組學中扮演著重要角色,但臨床應用中發現,肝臟脂肪含量波動、放化療所導致的腫瘤組織的纖維化程度、原發灶對血流動力學的影響等因素會對紋理參數造成影響[66-67]。此外,統計分析紋理特征采用的不同過濾器也會產生不同的結果,因此亟需制定統一規范的參數采集和恰當的過濾模式,才能真正地用于真實世界的臨床實踐[68]。其三,影像組學的深入研究需要影像醫學與工科計算機技術的密切合作,目前也缺乏醫工交叉學科的復合型人才,數據處理還處于初步階段,并未真正形成能夠廣泛應用于臨床的診斷預測產品。
4 未來展望與小結
隨著人工智能(artificial intelligence,AI)技術的興起及機器學習浪潮的推動,基于 AI 技術的機器深度學習的診斷預測方法是影像組學未來發展的必經之路。在對 LARC 患者 NCRT 療效的評價方面,建立快速、高效且精準的影像組學預測模型應用于臨床,從真正意義上發展成可為臨床所用的輔助預測工具,特別是在目前提倡精準醫療及個性化治療的大背景下,將成為低成本、無創且便捷的新型診斷評估方式。
綜上所述,影像組學是一項新興的影像學診斷技術,在 LARC 行 NCRT 效果的預測中發揮著重要作用,并通過流程化管理可優化治療方案,從而改善患者的短期與長期預后。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:李崢艷查閱文獻、撰寫綜述初稿;汪曉東和黃子星進行修改,宋彬教授校正。