非小細胞肺癌是全球癌癥死亡的主要原因,其發病率逐年升高,嚴重危害人類健康。早期的非小細胞肺癌依據癥狀體征一般難以被發現,因此準確的病理學診斷、精準的預后預測對于非小細胞肺癌患者制定最佳治療計劃、改善患者生存期至關重要。人工智能在非小細胞肺癌診療中的應用已顯示出良好的性能和巨大的潛力,本文介紹了人工智能在預測非小細胞肺癌分型、分期、基因組學和預后方面的研究進展。
引用本文: 王志林, 朱曉雷, 張瀟文, 馮義輝, 潘劍云, 姜杰, 耿國軍. 人工智能在非小細胞肺癌病理學和預后中應用的研究進展. 中國胸心血管外科臨床雜志, 2022, 29(9): 1223-1229. doi: 10.7507/1007-4848.202205033 復制
肺癌是一個重大的公共衛生問題,嚴重危害人類健康。世界衛生組織數據[1]顯示,2020年全世界新發肺癌病例約200萬例,肺癌死亡病例約180萬例。肺癌是我國最常見且死亡率最高的癌癥之一,2000—2016年間其發病率一直保持穩定的高增長趨勢[2]。國家癌癥中心最新數據[2]顯示,2016年中國新發肺癌病例高達82.8萬,而同年肺癌死亡病例高達65.7萬例。非小細胞肺癌(non-small cell lung cancer,NSCLC)在肺癌病理類型中占比為80%~85%[3],主要病理類型包括肺腺癌和肺鱗狀細胞癌(鱗癌)。研究[4-5]表明,早期NSCLC患者中ⅠA期、ⅠB期、ⅡA期和ⅡB期的5年生存率分別為77%~92%、68%、60%和53%,但晚期NSCLC患者的5年生存率約為6%。然而,早期NSCLC依據癥狀體征一般難以被發現,肺癌篩查也未引起高危人群重視,導致大部分NSCLC患者在確診時已經進展惡化到中晚期或伴發遠處轉移。因此,準確的組織病理學診斷對于NSCLC患者制定最佳治療計劃至關重要;對患者臨床預后進行精準預測,快速識別手術后預后不良的NSCLC患者,對提高患者術后生存質量有著至關重要的臨床意義。
1 人工智能概述
人工智能(artificial intelligence,AI)是計算機模擬人類某些思維過程和智能行為的應用[6]。AI的核心是機器學習,通過應用數學和統計方法來提高計算機的性能,包括有監督或無監督的方法。機器學習可應用于癌癥篩查,如乳房X光檢查中的計算機輔助檢測,顯著增加了放射科醫生篩查乳腺癌的敏感度[7]。諸多研究[8-13]表明,通過機器學習方法提取病理學信息可確定惡性腫瘤的亞型,包括肺癌、前列腺癌、結直腸癌和卵巢癌等。這些計算方法可以與其它臨床評估方法相輔相成,提高組織病理學評估的性能、正確性和穩定性[14]。
深度學習是機器學習廣義上的子領域,其工作原理是通過計算機自動生成大量人工神經網絡的連接,這些網絡的功能類似于人類大腦。深度學習具有直接從原始圖像生成高級特征信息的優勢,被證明可以在分割、分類和預測等各種任務中產生精準的結果,已成為醫學成像領域的領先機器學習工具[15-18]。其中,卷積神經網絡(convolutional neural networks,CNN)是常用于癌癥圖像分類的深度學習模型,包括遷移學習和自動編碼器等方法。它通過一系列連續的線性和非線性層將成像濾波器與人工神經網絡結合起來,能夠以良好的性能檢測腫瘤[15, 18-21]。例如,通過正電子發射計算機斷層顯像判斷淋巴結的轉移情況,結果發現深度學習的敏感性高于放射科醫師,但特異性低于放射科醫師[22]。
AI技術在預測NSCLC患者的預后中已經取得了很好的驗證[23]。根據臨床因素準確地將NSCLC患者分型、分期是癌癥治療的關鍵一步。到目前為止,臨床醫生還不能確定哪些早期NSCLC患者術后可能復發,但AI可以協助醫生更準確地預測[17]。因此,本文綜述了AI技術在NSCLC患者診斷、治療以及預后中的最新進展和應用。
2 人工智能預測非小細胞肺癌分型
病理學切片的目測檢查是腫瘤組織學分型的主要評估方法之一,通過活檢或手術等侵入性手段來獲取組織,人工閱片具有效率低、易出現疲勞閱片現象等缺點。另有研究[24]表明,視覺評估在某些腫瘤亞型和階段的診斷病例中被證明是不準確和不可重復的。NSCLC的病理學評估對于患者的診斷至關重要,而AI的應用在提高診斷精度和幫助減少人為錯誤方面具有巨大潛力。
NSCLC可分為3種主要的組織學類型:鱗癌、腺癌和大細胞癌。其中,肺腺癌和肺鱗癌的組織學特點的區別不明顯,尤其是低分化腫瘤。由于不同類型肺癌的治療方法有很大的差異,基于AI技術的計算機視覺算法在圖像分類方面表現出了非常好的性能,幫助病理科醫師檢測肺癌類型[25-28]。例如,Yu等[29]將傳統的閾值處理、圖像處理技術與隨機森林分類器、支持向量機或樸素貝葉斯分類器等機器學習方法相結合,結果顯示該方法在區分正常和腫瘤切片的曲線下面積(area under the curve,AUC)為0.85,區分肺腺癌和肺鱗癌切片的AUC為0.75;Khosravi等[30]基于CNN的深度學習方法構建了一個獨立的管道來有效地對肺腺癌和肺鱗癌1 520個蘇木精-伊紅染色(hematoxylin-eosin staining,HE染色)的全切片組織病理學圖像以及1 629個HE染色的高分辨率圖像進行分類,結果顯示基于斯坦福組織微陣列數據庫(TMAD)和TCGA圖像的肺部腫瘤亞型鑒別的準確率高達92%和100%,其中基于TCGA圖像的肺部腫瘤類型分類的AUC為0.83。Coudray?等[15]基于TCGA的1 634個全幻燈片圖像構建了一個深度CNN,包括1 176個腫瘤組織和459個正常組織,該深度學習模型的敏感性和特異性為89%和93%。通過分類模型,將全載玻片圖像分類為正常肺、肺腺癌或肺鱗癌,其準確性(AUC為0.97)顯著高于既往研究(AUC為 0.75和 0.83)[29-30],該模型性能與病理科醫師的診斷相當。
肺腺癌的亞型繁多,包括微小浸潤性腺癌、浸潤性非黏液性腺癌、浸潤性黏液腺癌、膠樣肺腺癌、腫瘤型腺癌(肺胎兒腺癌)、腸型肺腺癌等[31-32]。識別肺腺癌的組織學亞型對于腫瘤預后和治療極為重要,但對此類模式進行準確分類具有一定的挑戰性。一項研究[33]發現,對肺泡結構的維持或喪失的不同評估導致了腺泡和貼壁模式的不同分類,并且當兩者混合時,乳頭狀和微乳頭狀亞型的主要-次要分類是有爭議的。此外,即使是少量容易被忽視的高級模式也已被證明與更差的預后相關,尤其是對于微乳頭亞型[34]。由于病理學家之間缺乏一致性以及同一患者多種組織學模式的混合,亞型的分類對病理學家來說仍然是一個不小的挑戰。Wang等[35]回顧性納入3個醫療機構共1 222例非典型腺瘤樣增生、原位腺癌、微浸潤性腺癌、浸潤性腺癌5種主要成分的匿名術前CT圖像和病理標記,基于深度學習、放射組學策略和深度放射組學組合算法對組織學亞型的分類任務進行了建模,結果發現深度放射組學算法表明在2類(包括非典型腺瘤樣增生、原位腺癌+微浸潤腺癌),3類(無微乳頭狀或實性成分組、無微乳頭狀或實性成分組和以微乳頭狀和實性成分為主的組)分類中AUC分別達到0.8776和 0.8061;在8個分類(包括非典型腺瘤樣增生、原位腺癌、微浸潤腺癌、鱗狀腺癌、腺泡腺癌、乳頭狀腺癌、微乳頭狀腺癌和實性腺癌)中,內部驗證的AUC為0.739~0.940,其結果顯示AI在檢測肺腺癌亞型分類中取得了很好的表現。
Xiao等[36]從TCGA納入162個RNA數據集(肺腺癌n=135,對照組n=37),基于深度學習的多模型方法取得了令人滿意的結果,區分肺腺癌與正常肺組織的準確率達到了99.20%,在肺腺癌預測中明顯優于單個經典分類器。Wei等[28]選取143例獨立的肺腺癌數據集,該模型使用CNN來識別腫瘤細胞的區域,然后聚合這些分類以推斷任何給定數據的主要和次要組織學亞型。結果顯示AI模型的Kappa系數為0.525,與3位病理學家對主要模式進行分類的一致性為66.6%;病理學家Kappa系數為0.485,在該測試集上的一致性為62.7%,其結果略微優于3位病理學家的判讀結果。
通常,許多研究選擇了NSCLC的全切片圖像和基因圖譜的大型數據集來訓練深度學習模型或機器學習模型以構建穩健的AI方案,隨后在另一個獨立的數據集中進行了驗證[37-38]。與機器學習算法相比,能力不斷增強的CNN算法可能更適合區分NSCLC的異質性,尤其是數字整片。通過處理技術診斷NSCLC 的定量圖像和遺傳特征在提高組織病理學評估的效率、準確性和一致性方面具有價值。因此,AI技術在組織學圖像和基因圖譜中都可以作為肺腺癌病理亞型有前途的診斷工具。
3 人工智能預測非小細胞肺癌分期
目前NSCLC的分期基于腫瘤的大小和范圍、擴散至淋巴結的程度以及轉移程度。由于晚期Ⅱ~Ⅳ期患者難以提高生存率,治療方法應根據疾病進展量身定制,因此對早期患者進行準確分期至關重要[39]。據報道[40],基因表達變異在腫瘤進展和轉移中具有關鍵作用,因此表明遺傳生物標志物用于檢測和分類NSCLC亞群的可行性。盡管基因譜已被確定為臨床診斷或 NSCLC 結果的預測因子,但尚未確定基因譜是否可用作病理分期標志物。Choi等[41]研究了通過聯合自動編碼器網絡、CNN的級聯深度學習方法,從癌癥影像檔案的公共領域獲得了6個具有病理分期信息的NSCLC隊列,使用預處理計算機斷層掃描來分類早期和晚期NSCLC。結果表明,在CPTAC隊列中,與其它方法(AUC為0.6824~0.7206)相比,基于級聯深度學習模型的NSCLC早期分類的準確性達到了0.8649,敏感度為0.8000,特異性為0.9412,AUC為0.8206。另外,該模型在TCGA隊列中的NSCLC患者分期也顯示出了良好的結果,其準確性為0.8077,靈敏度為0.7692,特異性為0.8462,AUC為0.8343。
Dong等[42]納入TCGA 的369個肺腺癌轉錄組測序數據(甲基化數據和拷貝數變異),開發了一種基于機器學習的MLW-gcForest模型,其整合多模態遺傳數據在肺腺癌分級(準確度為0.908,精度為0.896)中取得了更好的分類性能,有效提高了肺腺癌分期的準確性,明顯優于傳統的機器學習算法。此外,Yang等[40]從TCGA數據庫納入600個肺腺癌病例數據集,通過16-miRNA特征選擇和支持向量機分類器來構建模型,結果發現分類模型具有準確區分肺腺癌病理階段的能力,16-miRNA 特征可以作為肺腺癌病理分期的有希望的診斷生物標志物。
通常,基因突變在腫瘤進展和腫瘤表型中起關鍵作用。盡管上述研究中鑒定的早期肺癌特征基因的表達譜具有預測準確和穩健的NSCLC分期能力,但與常規臨床變量相比,AI技術應通過更多研究進行驗證。
4 人工智能在非小細胞肺癌基因組學中的應用
基于組織的病理診斷是當前的金標準,但具有取樣誤差、原發性腫瘤和轉移部位之間的生物學異質性等局限性[43]。放射生物基因組學是指識別檢測到的病變中的生物基因組、蛋白質組改變,涉及圖像分割、特征提取和機器學習模型,以預測潛在的腫瘤基因型和臨床結果,提高臨床診斷的特異性、表征病變內的異質性,有助于腫瘤治療的選擇和預后。
Coudray?等[15]從TCGA下載了匹配患者樣本的基因突變數據,訓練CNN來預測肺腺癌中10個最常見的突變基因,結果發現其中6個突變基因STK11、EGFR、FAT1、SETBP1、KRAS和TP53的AUC值為0.733~0.856,這說明深度學習模型可以精準地幫助病理學家檢測癌癥基因突變。Shiri等[44]收集了NSCLC患者的186個正電子發射計算機斷層顯像圖像和175個低劑量計算機斷層掃描和對比增強診斷質量CT圖像,提取了2萬多個放射性特征,采用6種特征選擇方法和12種分類器來預測患者的EGFR和KRAS 基因突變狀態;結果發現機器學習算法比常規臨床放射特征方法有更好的預測能力,其中EGFR的AUC為0.82,KRAS的AUC為0.83。
Kobayashi等[45]通過添加元素輸入縮放使用基于深度學習(CNN和循環神經網絡)的方法進行基因型-表型關聯研究,選取950個NSCLC數據集,根據體細胞突變(即單核苷酸變異、插入和缺失)預測肺癌的組織學類型,發現了KRAS、EGFR、STK11和SETD2基因中的大多數似乎僅在肺腺癌中發生突變,而不是在肺鱗癌;STK11和KRAS突變在肺腺癌中的頻率比肺鱗癌高得多,KRAS在肺腺癌中的突變頻率是在肺鱗癌中的26倍,該模型實現了約80%的預測準確率。Wang等[46]通過深度學習無監督類型中的去噪自編碼器來分析13個已發表數據庫中的1 916個肺癌轉錄組數據,發現了35個基因特征(與一些癌癥相關的KEGG術語顯著相關,比如p53信號通路)可以作為肺腺癌的診斷、病理分型和預后的生物標志物,且這35個基因特征預后預測能力優于其它已發表的數百個預后基因[47-52]。
在臨床治療過程中,統一病理亞型的NSCLC在分子水平上可能有很大的表達差異,因此對治療的反應也不同,其中EGFR基因突變或ALK基因重排等基因改變對NSCLC預后具有預測意義。例如,病變中不規則邊界和毛玻璃樣混濁的存在與肺癌中EGFR的表達相關,可通過放射基因組學鑒定肺癌中EGFR的表達以及其它轉錄因子[53]。隨著靶向療法的出現(例如,程序性死亡受體1、程序性死亡配體1等),由AI驅動的放射基因組學有助于患者的靶向精準治療[54]。因此,放射組學有助于早期NSCLC的檢測、評估治療效果和預測治療相關結果。
5 人工智能預測非小細胞肺癌預后
早期肺腺癌手術治療后,ⅠB期或更晚期疾病患者通常接受輔助化療,生存率提高5%~10%,而近一半的肺腺癌有復發和隨后的疾病進展[38]。此外,HE 染色圖像中的一些形態特征與病理診斷和預后顯著相關,臨床工作者不易識別。然而,通過CNN和遞歸神經網絡(CNN和循環神經網絡)等深度學習方法分析NSCLC患者的CT圖像,進行多時間點研究來預測NSCLC患者的生存率、進展、轉移和復發等相關臨床結局[38]。Yu等[29]的研究從TCGA中獲取2 186例肺腺癌和鱗癌患者HE 染色的組織病理學全幻燈片圖像來預測鱗癌患者的存活率,結果顯示在 TCGA隊列中超過50%的Ⅰ期腺癌患者在初次診斷后5年內死亡,而約15%的患者存活超過10年。通過機器學習方法來分析9 879個定量圖像特征選擇頂級特征,在TCGA數據集中區分Ⅰ期腺癌(P<0.003)或鱗癌(P=0.023)的短期生存者和長期生存者。通過構建Cox比例風險模型,結合HE染色的顯微鏡病理圖像計算出腫瘤患者的生存指數,也成功區分了Ⅰ期腺癌隊列中的長期生存者和短期生存者。該項研究表明了基于定量特征的組織病理學圖像分類器可以成功預測肺腺癌和肺鱗癌患者的生存結果,這種能力優于病理學家。
Lee等[55]提出了一種基于神經網絡的危險函數和總生存時間預測模型,使用臨床病理變量來預測術后NSCLC患者在時間序列間隔內的復發概率。該模型不需要一些假設,簡單地解決CoxPH模型需滿足比例風險假設和線性變量的問題[56-59]。該研究納入了1 320例手術切除NSCLC患者的臨床病理特征(訓練隊列1 022例,外部驗證隊列298例),結果發現使用監督分類時間生存分析(su-DeepBTS)模型作為選擇器可以有效區分經手術切除的NSCLC患者中的低風險組和高風險組(P=1.86×10-11)和驗證群組(P=1.04×10-10)。對每個模型進行最優特征集訓練時,su-DeePBTS模型比傳統模型能更好地預測NSCLC預后,特別是在Ⅰ期患者中;因此該模型可作為深度學習的應用來預測腫瘤復發。
Hosny等[16]對5家機構的7個獨立數據集中1 194例NSCLC患者的CT成像進行綜合分析,以發現和驗證CNNs在接受放療和手術治療的患者中的預后能力。研究發現,CNN預測與放療開始后的2年總生存率(AUC=0.70)和手術(AUC=0.71)顯著相關。CNN還能夠在放療和手術數據集中顯著地將患者分為低死亡風險組和高死亡風險組。該研究證明了腫瘤內部和外部的區域,特別是腫瘤間質界面對預后特征有最大的貢獻,突出了腫瘤周圍組織在患者分層中的重要性。Siah等[60]分析了美國食品藥品監督管理局17個隨機臨床試驗中的8 925例患者。該模型預測樣本外數據的無進展生存期(progression-free survival,PFS)和總生存期 (overall survival,OS)的 C 指數分別為 0.67 和 0.73。PFS和OS的校準圖表明實際和預測的生存率之間有很好的一致性。此外,Kaplan-Meier生存曲線顯示,低風險組和高風險組之間的生存差異對于PFS和OS都是顯著的(對數秩檢驗P<0.001)。在接受免疫檢查點抑制劑和酪氨酸激酶抑制劑治療的患者中,生物標志物檢測呈陽性的患者比檢測呈陰性或未檢測的患者具有更高的OR和更有利的 PFS。對于OS而言,生物標志物程序性死亡配體1、EGFR或ALK的存在與生存率提高相關。該項研究反映了與基于這些生物標志物的抗癌療法個性化相關的臨床益處。
6 總結
綜上所述,基于AI在NSCLC病理學和預后中的應用已經取得了顯著的效果。然而,AI在實際的臨床應用中面臨著許多困難。
首先,AI仍然不能完全精準獲取圖像中所有數據,比如顯微圖像中的圖像偽影;偽影會嚴重影響圖像質量,使AI的自動計算結果出現錯誤,這也是AI面對的挑戰之一。其次,AI軟硬件設備的巨大成本投入,訓練數據需要廣泛且代表性樣本的疾病數據集,耗時長且成本高,目前缺乏相關的標準數據庫、權威機構制定的標準化原則和完備的國家政策法規支持,這使得AI的實際應用困難重重。前人的研究大多是由放射學、病理學和腫瘤學等專家互相獨立進行的,并專注于各自的領域;整合不同學科的數據和新舊技術有助于研究人員建立預測模型,多學科的融合也是AI要克服的困難。另外,AI在臨床中的應用同樣也面對倫理學方面的問題,當發生醫療糾紛時,誰為此負責?同時AI技術如果不能達到預期的效果,出現醫療糾紛的概率也會明顯增加。最后,隨著AI的高速發展,數據安全也是一個不容忽視的問題,我們應重視提高數據安全性和降低數據傳輸風險性。
盡管存在上述挑戰,AI在NSCLC上的應用是非常有前景的,AI將來可能會取代一些昂貴的分子檢測技術,提供更精確的生物標志物和組織病理學信息,以提升個性化癌癥治療水平,最終改進治療決策。因此,AI將會是臨床醫師在預測NSCLC病理學和預后過程中邁向精確醫學的高效方法和工具。
利益沖突:無。
作者貢獻:耿國軍、姜杰負責論文設計和修改;王志林、朱曉雷負責主要撰寫、修改論文和查閱文獻;張瀟文、馮義輝、潘劍云負責匯總部分文獻和參與修改部分論文。
肺癌是一個重大的公共衛生問題,嚴重危害人類健康。世界衛生組織數據[1]顯示,2020年全世界新發肺癌病例約200萬例,肺癌死亡病例約180萬例。肺癌是我國最常見且死亡率最高的癌癥之一,2000—2016年間其發病率一直保持穩定的高增長趨勢[2]。國家癌癥中心最新數據[2]顯示,2016年中國新發肺癌病例高達82.8萬,而同年肺癌死亡病例高達65.7萬例。非小細胞肺癌(non-small cell lung cancer,NSCLC)在肺癌病理類型中占比為80%~85%[3],主要病理類型包括肺腺癌和肺鱗狀細胞癌(鱗癌)。研究[4-5]表明,早期NSCLC患者中ⅠA期、ⅠB期、ⅡA期和ⅡB期的5年生存率分別為77%~92%、68%、60%和53%,但晚期NSCLC患者的5年生存率約為6%。然而,早期NSCLC依據癥狀體征一般難以被發現,肺癌篩查也未引起高危人群重視,導致大部分NSCLC患者在確診時已經進展惡化到中晚期或伴發遠處轉移。因此,準確的組織病理學診斷對于NSCLC患者制定最佳治療計劃至關重要;對患者臨床預后進行精準預測,快速識別手術后預后不良的NSCLC患者,對提高患者術后生存質量有著至關重要的臨床意義。
1 人工智能概述
人工智能(artificial intelligence,AI)是計算機模擬人類某些思維過程和智能行為的應用[6]。AI的核心是機器學習,通過應用數學和統計方法來提高計算機的性能,包括有監督或無監督的方法。機器學習可應用于癌癥篩查,如乳房X光檢查中的計算機輔助檢測,顯著增加了放射科醫生篩查乳腺癌的敏感度[7]。諸多研究[8-13]表明,通過機器學習方法提取病理學信息可確定惡性腫瘤的亞型,包括肺癌、前列腺癌、結直腸癌和卵巢癌等。這些計算方法可以與其它臨床評估方法相輔相成,提高組織病理學評估的性能、正確性和穩定性[14]。
深度學習是機器學習廣義上的子領域,其工作原理是通過計算機自動生成大量人工神經網絡的連接,這些網絡的功能類似于人類大腦。深度學習具有直接從原始圖像生成高級特征信息的優勢,被證明可以在分割、分類和預測等各種任務中產生精準的結果,已成為醫學成像領域的領先機器學習工具[15-18]。其中,卷積神經網絡(convolutional neural networks,CNN)是常用于癌癥圖像分類的深度學習模型,包括遷移學習和自動編碼器等方法。它通過一系列連續的線性和非線性層將成像濾波器與人工神經網絡結合起來,能夠以良好的性能檢測腫瘤[15, 18-21]。例如,通過正電子發射計算機斷層顯像判斷淋巴結的轉移情況,結果發現深度學習的敏感性高于放射科醫師,但特異性低于放射科醫師[22]。
AI技術在預測NSCLC患者的預后中已經取得了很好的驗證[23]。根據臨床因素準確地將NSCLC患者分型、分期是癌癥治療的關鍵一步。到目前為止,臨床醫生還不能確定哪些早期NSCLC患者術后可能復發,但AI可以協助醫生更準確地預測[17]。因此,本文綜述了AI技術在NSCLC患者診斷、治療以及預后中的最新進展和應用。
2 人工智能預測非小細胞肺癌分型
病理學切片的目測檢查是腫瘤組織學分型的主要評估方法之一,通過活檢或手術等侵入性手段來獲取組織,人工閱片具有效率低、易出現疲勞閱片現象等缺點。另有研究[24]表明,視覺評估在某些腫瘤亞型和階段的診斷病例中被證明是不準確和不可重復的。NSCLC的病理學評估對于患者的診斷至關重要,而AI的應用在提高診斷精度和幫助減少人為錯誤方面具有巨大潛力。
NSCLC可分為3種主要的組織學類型:鱗癌、腺癌和大細胞癌。其中,肺腺癌和肺鱗癌的組織學特點的區別不明顯,尤其是低分化腫瘤。由于不同類型肺癌的治療方法有很大的差異,基于AI技術的計算機視覺算法在圖像分類方面表現出了非常好的性能,幫助病理科醫師檢測肺癌類型[25-28]。例如,Yu等[29]將傳統的閾值處理、圖像處理技術與隨機森林分類器、支持向量機或樸素貝葉斯分類器等機器學習方法相結合,結果顯示該方法在區分正常和腫瘤切片的曲線下面積(area under the curve,AUC)為0.85,區分肺腺癌和肺鱗癌切片的AUC為0.75;Khosravi等[30]基于CNN的深度學習方法構建了一個獨立的管道來有效地對肺腺癌和肺鱗癌1 520個蘇木精-伊紅染色(hematoxylin-eosin staining,HE染色)的全切片組織病理學圖像以及1 629個HE染色的高分辨率圖像進行分類,結果顯示基于斯坦福組織微陣列數據庫(TMAD)和TCGA圖像的肺部腫瘤亞型鑒別的準確率高達92%和100%,其中基于TCGA圖像的肺部腫瘤類型分類的AUC為0.83。Coudray?等[15]基于TCGA的1 634個全幻燈片圖像構建了一個深度CNN,包括1 176個腫瘤組織和459個正常組織,該深度學習模型的敏感性和特異性為89%和93%。通過分類模型,將全載玻片圖像分類為正常肺、肺腺癌或肺鱗癌,其準確性(AUC為0.97)顯著高于既往研究(AUC為 0.75和 0.83)[29-30],該模型性能與病理科醫師的診斷相當。
肺腺癌的亞型繁多,包括微小浸潤性腺癌、浸潤性非黏液性腺癌、浸潤性黏液腺癌、膠樣肺腺癌、腫瘤型腺癌(肺胎兒腺癌)、腸型肺腺癌等[31-32]。識別肺腺癌的組織學亞型對于腫瘤預后和治療極為重要,但對此類模式進行準確分類具有一定的挑戰性。一項研究[33]發現,對肺泡結構的維持或喪失的不同評估導致了腺泡和貼壁模式的不同分類,并且當兩者混合時,乳頭狀和微乳頭狀亞型的主要-次要分類是有爭議的。此外,即使是少量容易被忽視的高級模式也已被證明與更差的預后相關,尤其是對于微乳頭亞型[34]。由于病理學家之間缺乏一致性以及同一患者多種組織學模式的混合,亞型的分類對病理學家來說仍然是一個不小的挑戰。Wang等[35]回顧性納入3個醫療機構共1 222例非典型腺瘤樣增生、原位腺癌、微浸潤性腺癌、浸潤性腺癌5種主要成分的匿名術前CT圖像和病理標記,基于深度學習、放射組學策略和深度放射組學組合算法對組織學亞型的分類任務進行了建模,結果發現深度放射組學算法表明在2類(包括非典型腺瘤樣增生、原位腺癌+微浸潤腺癌),3類(無微乳頭狀或實性成分組、無微乳頭狀或實性成分組和以微乳頭狀和實性成分為主的組)分類中AUC分別達到0.8776和 0.8061;在8個分類(包括非典型腺瘤樣增生、原位腺癌、微浸潤腺癌、鱗狀腺癌、腺泡腺癌、乳頭狀腺癌、微乳頭狀腺癌和實性腺癌)中,內部驗證的AUC為0.739~0.940,其結果顯示AI在檢測肺腺癌亞型分類中取得了很好的表現。
Xiao等[36]從TCGA納入162個RNA數據集(肺腺癌n=135,對照組n=37),基于深度學習的多模型方法取得了令人滿意的結果,區分肺腺癌與正常肺組織的準確率達到了99.20%,在肺腺癌預測中明顯優于單個經典分類器。Wei等[28]選取143例獨立的肺腺癌數據集,該模型使用CNN來識別腫瘤細胞的區域,然后聚合這些分類以推斷任何給定數據的主要和次要組織學亞型。結果顯示AI模型的Kappa系數為0.525,與3位病理學家對主要模式進行分類的一致性為66.6%;病理學家Kappa系數為0.485,在該測試集上的一致性為62.7%,其結果略微優于3位病理學家的判讀結果。
通常,許多研究選擇了NSCLC的全切片圖像和基因圖譜的大型數據集來訓練深度學習模型或機器學習模型以構建穩健的AI方案,隨后在另一個獨立的數據集中進行了驗證[37-38]。與機器學習算法相比,能力不斷增強的CNN算法可能更適合區分NSCLC的異質性,尤其是數字整片。通過處理技術診斷NSCLC 的定量圖像和遺傳特征在提高組織病理學評估的效率、準確性和一致性方面具有價值。因此,AI技術在組織學圖像和基因圖譜中都可以作為肺腺癌病理亞型有前途的診斷工具。
3 人工智能預測非小細胞肺癌分期
目前NSCLC的分期基于腫瘤的大小和范圍、擴散至淋巴結的程度以及轉移程度。由于晚期Ⅱ~Ⅳ期患者難以提高生存率,治療方法應根據疾病進展量身定制,因此對早期患者進行準確分期至關重要[39]。據報道[40],基因表達變異在腫瘤進展和轉移中具有關鍵作用,因此表明遺傳生物標志物用于檢測和分類NSCLC亞群的可行性。盡管基因譜已被確定為臨床診斷或 NSCLC 結果的預測因子,但尚未確定基因譜是否可用作病理分期標志物。Choi等[41]研究了通過聯合自動編碼器網絡、CNN的級聯深度學習方法,從癌癥影像檔案的公共領域獲得了6個具有病理分期信息的NSCLC隊列,使用預處理計算機斷層掃描來分類早期和晚期NSCLC。結果表明,在CPTAC隊列中,與其它方法(AUC為0.6824~0.7206)相比,基于級聯深度學習模型的NSCLC早期分類的準確性達到了0.8649,敏感度為0.8000,特異性為0.9412,AUC為0.8206。另外,該模型在TCGA隊列中的NSCLC患者分期也顯示出了良好的結果,其準確性為0.8077,靈敏度為0.7692,特異性為0.8462,AUC為0.8343。
Dong等[42]納入TCGA 的369個肺腺癌轉錄組測序數據(甲基化數據和拷貝數變異),開發了一種基于機器學習的MLW-gcForest模型,其整合多模態遺傳數據在肺腺癌分級(準確度為0.908,精度為0.896)中取得了更好的分類性能,有效提高了肺腺癌分期的準確性,明顯優于傳統的機器學習算法。此外,Yang等[40]從TCGA數據庫納入600個肺腺癌病例數據集,通過16-miRNA特征選擇和支持向量機分類器來構建模型,結果發現分類模型具有準確區分肺腺癌病理階段的能力,16-miRNA 特征可以作為肺腺癌病理分期的有希望的診斷生物標志物。
通常,基因突變在腫瘤進展和腫瘤表型中起關鍵作用。盡管上述研究中鑒定的早期肺癌特征基因的表達譜具有預測準確和穩健的NSCLC分期能力,但與常規臨床變量相比,AI技術應通過更多研究進行驗證。
4 人工智能在非小細胞肺癌基因組學中的應用
基于組織的病理診斷是當前的金標準,但具有取樣誤差、原發性腫瘤和轉移部位之間的生物學異質性等局限性[43]。放射生物基因組學是指識別檢測到的病變中的生物基因組、蛋白質組改變,涉及圖像分割、特征提取和機器學習模型,以預測潛在的腫瘤基因型和臨床結果,提高臨床診斷的特異性、表征病變內的異質性,有助于腫瘤治療的選擇和預后。
Coudray?等[15]從TCGA下載了匹配患者樣本的基因突變數據,訓練CNN來預測肺腺癌中10個最常見的突變基因,結果發現其中6個突變基因STK11、EGFR、FAT1、SETBP1、KRAS和TP53的AUC值為0.733~0.856,這說明深度學習模型可以精準地幫助病理學家檢測癌癥基因突變。Shiri等[44]收集了NSCLC患者的186個正電子發射計算機斷層顯像圖像和175個低劑量計算機斷層掃描和對比增強診斷質量CT圖像,提取了2萬多個放射性特征,采用6種特征選擇方法和12種分類器來預測患者的EGFR和KRAS 基因突變狀態;結果發現機器學習算法比常規臨床放射特征方法有更好的預測能力,其中EGFR的AUC為0.82,KRAS的AUC為0.83。
Kobayashi等[45]通過添加元素輸入縮放使用基于深度學習(CNN和循環神經網絡)的方法進行基因型-表型關聯研究,選取950個NSCLC數據集,根據體細胞突變(即單核苷酸變異、插入和缺失)預測肺癌的組織學類型,發現了KRAS、EGFR、STK11和SETD2基因中的大多數似乎僅在肺腺癌中發生突變,而不是在肺鱗癌;STK11和KRAS突變在肺腺癌中的頻率比肺鱗癌高得多,KRAS在肺腺癌中的突變頻率是在肺鱗癌中的26倍,該模型實現了約80%的預測準確率。Wang等[46]通過深度學習無監督類型中的去噪自編碼器來分析13個已發表數據庫中的1 916個肺癌轉錄組數據,發現了35個基因特征(與一些癌癥相關的KEGG術語顯著相關,比如p53信號通路)可以作為肺腺癌的診斷、病理分型和預后的生物標志物,且這35個基因特征預后預測能力優于其它已發表的數百個預后基因[47-52]。
在臨床治療過程中,統一病理亞型的NSCLC在分子水平上可能有很大的表達差異,因此對治療的反應也不同,其中EGFR基因突變或ALK基因重排等基因改變對NSCLC預后具有預測意義。例如,病變中不規則邊界和毛玻璃樣混濁的存在與肺癌中EGFR的表達相關,可通過放射基因組學鑒定肺癌中EGFR的表達以及其它轉錄因子[53]。隨著靶向療法的出現(例如,程序性死亡受體1、程序性死亡配體1等),由AI驅動的放射基因組學有助于患者的靶向精準治療[54]。因此,放射組學有助于早期NSCLC的檢測、評估治療效果和預測治療相關結果。
5 人工智能預測非小細胞肺癌預后
早期肺腺癌手術治療后,ⅠB期或更晚期疾病患者通常接受輔助化療,生存率提高5%~10%,而近一半的肺腺癌有復發和隨后的疾病進展[38]。此外,HE 染色圖像中的一些形態特征與病理診斷和預后顯著相關,臨床工作者不易識別。然而,通過CNN和遞歸神經網絡(CNN和循環神經網絡)等深度學習方法分析NSCLC患者的CT圖像,進行多時間點研究來預測NSCLC患者的生存率、進展、轉移和復發等相關臨床結局[38]。Yu等[29]的研究從TCGA中獲取2 186例肺腺癌和鱗癌患者HE 染色的組織病理學全幻燈片圖像來預測鱗癌患者的存活率,結果顯示在 TCGA隊列中超過50%的Ⅰ期腺癌患者在初次診斷后5年內死亡,而約15%的患者存活超過10年。通過機器學習方法來分析9 879個定量圖像特征選擇頂級特征,在TCGA數據集中區分Ⅰ期腺癌(P<0.003)或鱗癌(P=0.023)的短期生存者和長期生存者。通過構建Cox比例風險模型,結合HE染色的顯微鏡病理圖像計算出腫瘤患者的生存指數,也成功區分了Ⅰ期腺癌隊列中的長期生存者和短期生存者。該項研究表明了基于定量特征的組織病理學圖像分類器可以成功預測肺腺癌和肺鱗癌患者的生存結果,這種能力優于病理學家。
Lee等[55]提出了一種基于神經網絡的危險函數和總生存時間預測模型,使用臨床病理變量來預測術后NSCLC患者在時間序列間隔內的復發概率。該模型不需要一些假設,簡單地解決CoxPH模型需滿足比例風險假設和線性變量的問題[56-59]。該研究納入了1 320例手術切除NSCLC患者的臨床病理特征(訓練隊列1 022例,外部驗證隊列298例),結果發現使用監督分類時間生存分析(su-DeepBTS)模型作為選擇器可以有效區分經手術切除的NSCLC患者中的低風險組和高風險組(P=1.86×10-11)和驗證群組(P=1.04×10-10)。對每個模型進行最優特征集訓練時,su-DeePBTS模型比傳統模型能更好地預測NSCLC預后,特別是在Ⅰ期患者中;因此該模型可作為深度學習的應用來預測腫瘤復發。
Hosny等[16]對5家機構的7個獨立數據集中1 194例NSCLC患者的CT成像進行綜合分析,以發現和驗證CNNs在接受放療和手術治療的患者中的預后能力。研究發現,CNN預測與放療開始后的2年總生存率(AUC=0.70)和手術(AUC=0.71)顯著相關。CNN還能夠在放療和手術數據集中顯著地將患者分為低死亡風險組和高死亡風險組。該研究證明了腫瘤內部和外部的區域,特別是腫瘤間質界面對預后特征有最大的貢獻,突出了腫瘤周圍組織在患者分層中的重要性。Siah等[60]分析了美國食品藥品監督管理局17個隨機臨床試驗中的8 925例患者。該模型預測樣本外數據的無進展生存期(progression-free survival,PFS)和總生存期 (overall survival,OS)的 C 指數分別為 0.67 和 0.73。PFS和OS的校準圖表明實際和預測的生存率之間有很好的一致性。此外,Kaplan-Meier生存曲線顯示,低風險組和高風險組之間的生存差異對于PFS和OS都是顯著的(對數秩檢驗P<0.001)。在接受免疫檢查點抑制劑和酪氨酸激酶抑制劑治療的患者中,生物標志物檢測呈陽性的患者比檢測呈陰性或未檢測的患者具有更高的OR和更有利的 PFS。對于OS而言,生物標志物程序性死亡配體1、EGFR或ALK的存在與生存率提高相關。該項研究反映了與基于這些生物標志物的抗癌療法個性化相關的臨床益處。
6 總結
綜上所述,基于AI在NSCLC病理學和預后中的應用已經取得了顯著的效果。然而,AI在實際的臨床應用中面臨著許多困難。
首先,AI仍然不能完全精準獲取圖像中所有數據,比如顯微圖像中的圖像偽影;偽影會嚴重影響圖像質量,使AI的自動計算結果出現錯誤,這也是AI面對的挑戰之一。其次,AI軟硬件設備的巨大成本投入,訓練數據需要廣泛且代表性樣本的疾病數據集,耗時長且成本高,目前缺乏相關的標準數據庫、權威機構制定的標準化原則和完備的國家政策法規支持,這使得AI的實際應用困難重重。前人的研究大多是由放射學、病理學和腫瘤學等專家互相獨立進行的,并專注于各自的領域;整合不同學科的數據和新舊技術有助于研究人員建立預測模型,多學科的融合也是AI要克服的困難。另外,AI在臨床中的應用同樣也面對倫理學方面的問題,當發生醫療糾紛時,誰為此負責?同時AI技術如果不能達到預期的效果,出現醫療糾紛的概率也會明顯增加。最后,隨著AI的高速發展,數據安全也是一個不容忽視的問題,我們應重視提高數據安全性和降低數據傳輸風險性。
盡管存在上述挑戰,AI在NSCLC上的應用是非常有前景的,AI將來可能會取代一些昂貴的分子檢測技術,提供更精確的生物標志物和組織病理學信息,以提升個性化癌癥治療水平,最終改進治療決策。因此,AI將會是臨床醫師在預測NSCLC病理學和預后過程中邁向精確醫學的高效方法和工具。
利益沖突:無。
作者貢獻:耿國軍、姜杰負責論文設計和修改;王志林、朱曉雷負責主要撰寫、修改論文和查閱文獻;張瀟文、馮義輝、潘劍云負責匯總部分文獻和參與修改部分論文。