引用本文: 戴宗林, 梁宇鑫, 劉易隴, 黃孝倫. 機器學習在肝臟疾病診療中的應用進展. 中國普外基礎與臨床雜志, 2023, 30(6): 764-768. doi: 10.7507/1007-9424.202302008 復制
機器學習作為一門人工智能(artificial intelligence,AI)科學,通過統計學算法,對大量數據進行學習和運算后,利用生成的經驗模型進行應用[1]。目前,機器學習也逐漸應用于肝臟疾病領域[2-3]。它通過分析臨床數據,發現變量間的新模式及相關性并生成預測模型,可多維度反映肝臟疾病的情況,從而實現個體化醫療服務和提高醫療質量。該技術可應用于脂肪肝、肝硬化、肝細胞癌、肝棘球蚴病、急性肝功能衰竭等[4]多種肝臟疾病的診療過程中,其模型效能已得到初步證實。本文將就機器學習在肝臟疾病的診斷分類、治療決策的選擇、臨床結局的評估等多方面應用進行系統綜述,為臨床醫師提供臨床診療經驗,也為機器學習應用于臨床實踐提供參考。
1 機器學習的概述
機器學習是一門多學科交叉的AI應用技術,涵蓋概率論、統計學、近似理論、復雜算法等,擅于優化程序、處理信息數據,以建立最佳的模型標準[5]。機器學習根據任務類型可分為監督學習、無監督學習、半監督學習和強化學習[6]。其常見的算法包括樸素貝葉斯(naive Bayes classifier,NB)、k-近鄰(k-nearest neighbors,KNN)、邏輯回歸(logistic regression,LR)、決策樹、隨機森林(random forest,RF)、梯度提升決策樹(gradient boosting decision tree,GBDT)、支持向量機(support vector machine,SVM)、人工神經網絡(artificial neural networks,ANN)等[7]。機器學習的優勢在于利用不同的算法去適應各種類型的數據,在計算機技術輔助下高效地處理大量數據信息,從而發現變量間的新模式及相關性并生成運算模型而被應用于各個領域。醫療領域存在復雜多樣的臨床數據分析需求,因此利用機器學習方法建立預測模型在臨床應用方面有著巨大前景。
2 機器學習在肝臟疾病中的應用
2.1 機器學習在肝臟疾病診斷及分類中的應用
機器學習通過納入患者的實驗室或影像學資料等,分析變量相關性,以算法擬合建立預測模型,從而對肝臟疾病進行早期診斷及分類。其優點在于減少了如內鏡檢查等侵入性操作,降低患者不適感,同時為患者能得到早期診治提供了先機。
2.1.1 在早期肝實質性病變中的應用
早期肝實質病變常見于肝臟慢性炎癥或長期代謝異常等所造成的肝損害。肝臟在病變早期能發揮代償作用,往往不會表現出明顯臨床癥狀,從而掩蓋病因。當肝臟功能處于失代償時,肝臟實質會進一步受損,此時容易出現各類并發癥。因此,越早識別肝臟病變及損害程度,就有望在早期阻止肝臟功能進一步損害。
Ji等[8]以及雷麗等[9]采用了機器學習方法來建立大規模人群中的脂肪肝病預測模型,其模型的曲線下面積(area under curve,AUC)均大于等于0.95,準確率接近于0.90。戴曉霞等[10]以及Lim等[11]利用機器學習方法成功建立了肝脂肪變性預測模型。這表明機器學習有著良好的診斷效果,可識別出肝臟早期病損。Wang等[12]開展了多中心前瞻性研究,納入1 990份患者的影像學資料,運用卷積神經網絡開發彈性成像影像組學模型以評估慢性乙型肝炎患者的肝纖維化程度,研究以肝活檢作為金標準,結果機器學習模型的AUC高達0.97。Hatami等[13]用KNN算法開發基于常規實驗室和臨床數據的評分系統,該研究表明模型在診斷不同程度的肝硬化腹水方面準確性達0.84。以上研究提示,用機器學習方法建立的肝硬化預測模型的準確率較高,在明確肝臟損害程度情況上與肝活檢評價效果相近。
機器學習在收集大量臨床數據的基礎上,分析變量關系,納入建模運算,構建脂肪肝、肝硬化等常見疾病的早期診斷模型,有助于篩查高危因素、進行早期治療。然而,對于重金屬蓄積所導致肝實質損害等少見的長期慢性肝損害的數據較少,因此建立機器學習模型較困難,未來有望通過大數據整理或算法更新彌補這一短板。
2.1.2 在肝臟腫瘤性病變中的應用
肝臟腫瘤性病變根據細胞異型性可分為良性和惡性,根據腫瘤的來源可分為原發性和繼發性,不同的類型對應了不同的治療方式,因此明確腫瘤具體分型分類尤為重要。
Mao等[14]收集了1 940份影像組學資料,采用LR等算法對肝癌進行分類,結果表明LR模型的AUC為0.82,準確度為0.84,可作為術前非侵入性方法區分原發性肝腫瘤和轉移性肝腫瘤。Oyama等[15]納入了原發性肝細胞癌、轉移性腫瘤和肝血管瘤患者的核磁共振圖像資料,選用紋理分析和同源拓撲數據分析,結果評估肝臟腫瘤分類的準確性高達92%。這都表明影像學組分析對肝臟腫瘤來源有良好的分類效果。胥生科等[16]對比采集肝癌、肝硬化和健康人的血清增強拉曼信號,運用主成分分析、線性判別分析、SVM、正交偏最小二乘判別分析等算法預測肝癌分類,其最佳分類效果的準確度達89.3%,敏感度為80.7%,特異度為93.2%,表明該研究成功建立了新型肝癌分類模型。結果證明,通過機器學習算法,利用臨床數據對腫瘤的分類是可行的。此外,Li等[17]通過研究結直腸癌肝轉移(colorectal cancer liver metastasis,CRLM)和非CRLM患者的影像組學信息,采用LR算法,其結果顯示AUC為0.75,表明模型對CRLM有良好的診斷能力。Yang等[18]基于肝臟成像報告及數據系統,納入116例病理確診的肝細胞癌微血管浸潤患者,將患者按1∶1比例隨機分配至訓練集和驗證集,以期建立機器學習識別模型;結果表明,LR模型驗證集的AUC為0.72,考慮其預測效果欠佳的原因在于運算數據樣本量過少,無法在交叉運算中修正參數,從而無法發揮機器學習的優勢。
以上研究證實,利用臨床數據建立機器學習模型從而進行肝臟腫瘤分類效果較好。其優勢在于保證診斷準確性的同時減少了一些侵入性操作,這在一定程度上降低了患者的不適感,然而該方法參與運算的局限性在于需大量臨床樣本量的支持。因此為減少模型誤差,提高預測準確率,預測模型的建立需要足量的臨床數據,這也增加了機器學習模型開展的難度。
2.1.3 在其他少見肝臟疾病中的應用
目前對于少見的肝臟疾病,有研究人員也利用機器學習方法對建立預測模型進行了嘗試。
張旭輝等[19]通過收集肝棘球蚴病患者的超聲聲像圖,并采用內核邏輯回歸與高斯核函數型支持向量機構建肝棘球蚴病分型模型,其AUC達0.88,表明超聲影像組學在診斷中發揮重要作用。許文瑤等[20]提取了泡型肝棘球蚴病(hepatic alveolar echinococcosis,HAE)患者的影像組學特征,建立XGBoost模型預測HAE邊緣浸潤帶情況,模型結果的AUC為0.94,表明其擁有良好的預測能力。
目前機器學習較少應用于少見肝臟疾病,原因在于少見疾病的發病率低、臨床資料不足,沒有足夠的樣本量支持機器學習運算與驗證。因此,更需要臨床醫師進一步發現和報道少見病例情況并分享病例資料,提高醫療領域對此類疾病的重視和了解。
2.2 機器學習在肝臟疾病治療決策中的應用
臨床醫師在患者診治過程中會面臨高風險的醫療決策的選擇,而根據研究表明,利用機器學習對現有臨床數據進行分析,有助于減少醫療風險,選擇最佳的治療方案[21]。
2.2.1 在有創治療決策中的應用
肝臟的有創治療存在著不可避免的操作風險。機器學習在分析臨床資料基礎上評估操作風險性,為醫師選擇治療方案提供了參考。
Jung等[22]納入小兒肝移植圍手術期臨床指標,將術前肝性腦病、手術結束時的鈉含量、肝動脈血栓和術后第7天的總膽紅素水平作為結局特征,采用ANN算法評估小兒肝移植90 d內的移植失敗風險,結果模型AUC為0.89,這為臨床醫生行小兒肝移植治療的決策時,需重點關注的指標提供了參考意見。Giglio等[23]收集了術前活體供肝數據,以機器學習方法對移植物重量匹配程度進行估計,結果顯示,模型平均絕對誤差值為50 g(標準差為62 g),平均絕對百分比誤差為10.3%,這為匹配肝移植供體的移植物提供了參考。Chen等[24]收集了肝移植手術患者的臨床數據,納入了天冬氨酸氨基轉移酶等多類變量進行運算,CatBoost模型的AUC為0.81,這為預測移植術中大量輸血的風險提供了經驗。Abajian等[25]研究介入治療肝細胞癌患者術后隨訪結果和基于圍手術期核磁共振資料的相關性,以預測經動脈化療栓塞的療效,其總體準確率為72%。嚴律南等[26]基于臨床檢驗數據、影像學數據,對肝癌患者采用GBDT建立肝癌臨床決策支持系統,經該系統計算后可立即給出治療方案;結果表明,手術切除準確率為95.2%,消融準確率為88.9%,介入準確率為94.1%,肝移植準確率為75.0%。
基于機器學習算法對治療后反饋的臨床資料進行分析,可明確在治療過程中的風險性,有助于臨床醫師于既往經驗或案例上做出合適的治療決策,從而降低醫療風險。
2.2.2 在無創治療決策中的應用
藥物治療是肝臟疾病中重要的無創治療方法。然而由于個體化差異,藥物在運用的過程中存在引起不良反應及肝毒性的風險。機器學習將藥物的性質、臨床療效和不良反應納入建模運算,為患者的藥物選擇提供參考建議。
Liu等[27]從DrugDex、DrugPoints和DailyMed數據庫中收集不同類型的藥物特征,提取包括急性肝功能衰竭等7種類型的肝不良反應作為終點變量,預測藥物性肝損傷(drug-induced liver injury,DILI)的發生。LR預測模型中,化學指紋圖譜和結合蛋白的AUC均在0.8以上,有助于醫師在同類藥品中選擇不良反應發生率低的藥物。Minerali等[28]參考了由FDA整理的DILIRank數據庫,結合DILI患者的數據,采用效果最佳的NB模型,其AUC為0.81,準確性為0.74,有助于個體化選擇藥物以減少DILI的發生。Kim等[29]選擇接受尼羅替尼治療的患者為研究對象,基于各項肝功能指標,開發機器學習模型來預測肝毒性發生的危險因素;研究表明,使用H2阻斷劑使尼羅替尼誘導的肝毒性風險降低,而男性和藥物的高劑量與肝毒性增加有關,這為個體化藥物選擇提供了經驗。
肝臟疾病應用治療藥物時,預防肝不良反應和肝毒性的發生尤為重要。機器學習方法有助于臨床醫師針對個體化情況制定以藥物為主的系統治療方案。然而,對于藥物數據的分析需要足夠大的樣本量且即時反饋新型藥物的臨床療效。因此,更需要制藥行業、生物醫學研究機構和臨床醫療機構進行藥物的數據共享。
2.3 機器學習在預測肝臟疾病臨床結局中的應用
隨著康復組學[30]概念的興起,患者臨床結局成為治療的關注重點[31]。機器學習整合患者的多項隨訪資料,綜合判斷患者的預后情況,為早期制定康復治療計劃提供寶貴的經驗。
2.3.1 評估腫瘤性病變的預后
肝臟腫瘤具有良性腫瘤惡變、惡性腫瘤復發轉移等生物學特性,因此肝腫瘤患者需要接受定期隨訪。機器學習通過對患者治療期間的數據分析,篩選出術后不良預后的高危人群,有利于在隨訪中做到早發現早治療。
Saillard等[32]研究行手術切除治療的肝細胞癌患者數據,基于全切片數字化組織學切片進行深度學習運算,以卷積神經網絡提取特征,建立患者生存模型,其中“SCHMOWDER”和“CHOWDER”模型生存預測的風險分數一致性指數(C-indexes)分別達到0.78和0.75,高于與生存相關的所有基線變量的綜合評分,為組織病理學數據預測肝細胞癌預后情況提供了經驗,研究表明腫瘤情況可以指導預后評估及后續治療。Liu等[33]基于肝癌患者治療期間的臨床數據,構建梯度促進生存模型來預測患者的臨床結局,其C-indexes均在0.8以上;同時該研究制定了預后風險分組標準,表明高風險分數與臨床預后不良結局呈正相關。Wang等[34]納入肝細胞癌患者的臨床數據,探究術后死亡情況,RF模型的AUC為0.80,精確度為0.73。Jolissaint等[35]納入肝內膽管癌手術患者進行回顧性研究,結合影像組學特征,采用機器學習方法對腫瘤病灶切除后的復發情況進行預測,結果表明腫瘤大小等特征預測復發情況的AUC為0.84,為影像組學和機器學習評估腫瘤復發提供了參考經驗。同時,這也提醒臨床醫師在腫瘤后續治療中應結合分期情況及時調整治療方案。崔金濤等[36]以腹腔鏡肝血管瘤切除術患者作為研究對象,探討釓塞酸二鈉增強MRI影像組學對手術療效及結局的預測價值,其logistic回歸中模型訓練集的AUC大于等于0.8,研究表明根據術中腹腔鏡肝血管瘤情況能夠預測出術后療效。
機器學習通過納入包括生化代謝物的改變、影像學資料等建立預后模型運算,分析治療期間臨床資料與預后情況的相關性,為幫助患者調整隨訪策略并改善未來預后提供了參考。
2.3.2 評估非腫瘤性病變的預后
非腫瘤性病變的定期隨訪檢查,有利于判斷治療的效果以及自身肝臟情況,避免隱藏病情的進展或惡化。機器學習通過患者臨床數據構建模型,預測疾病進展和預后,有利于明確治療效果。
Guo等[37]研究了肝硬化患者住院期間的臨床數據,采用深度神經網絡探究患者臨床指標與臨床結局的關系,該模型預測90 d、180 d和365 d死亡率的AUC分別達到0.88、0.86和0.85,且研究發現堿性磷酸酶、丙氨酸氨基轉移酶和血紅蛋白水平與患者臨床結局密切相關。Park等[38]研究了丙型肝炎病毒(HCV)感染患者病毒載量等臨床實驗室資料,采用梯度提升機以預測HCV感染者的抗病毒療效情況,結果C-indexes為0.69,這有助于篩選抗病毒效果欠佳的相關因素。Tonon等[39]采用極端梯度提升交叉驗證模型算法,建立急性肝功能衰竭患者30 d的死亡預測模型,該模型的AUC為0.88,該研究為運用臨床參數預測急性肝臟疾病患者的預后提供了經驗。
3 展望
綜上所述,機器學習在肝臟疾病領域的臨床應用取得了良好的效果,并且在針對疾病的診斷、治療、預后等多方面有著巨大潛力。基于臨床數據,采用機器學習方法建立預測模型,有助于篩選高危人群、預測疾病進展、給予個體化治療方案、調整治療策略、明確治療效果。機器學習作為新興人工智能技術,在提高醫療服務水平和改善患者生存質量方面有著巨大的前景。然而,建立機器學習模型仍需克服一些難點。第一,模型需要足夠大的樣本量進行運算與修正,以最大程度減少數據偏倚及建模誤差。第二,不同實驗室儀器設備及診斷標準可能導致各項結果存在差異。第三,預測效果需經長期臨床驗證,以確保計算機運算結果與生物學機制相符合。第四,人工智能機器學習應用于醫療領域需要涉及個人信息,因此在隱私保護和知情同意方面需要進一步完善標準和制度。隨著技術日益成熟、信息不斷豐富、標準和制度更加完善,機器學習技術在肝臟疾病領域的應用將會向更科學和更高效的方向前進,以期提高醫療服務的水平和質量。
重要聲明
利益沖突聲明:作者之間無利益沖突。
作者貢獻聲明:戴宗林負責文章整體構思、文獻檢索、起草及修改稿件;梁宇鑫和劉易隴負責起草及修改稿件;黃孝倫負責文章的指導及審核。
機器學習作為一門人工智能(artificial intelligence,AI)科學,通過統計學算法,對大量數據進行學習和運算后,利用生成的經驗模型進行應用[1]。目前,機器學習也逐漸應用于肝臟疾病領域[2-3]。它通過分析臨床數據,發現變量間的新模式及相關性并生成預測模型,可多維度反映肝臟疾病的情況,從而實現個體化醫療服務和提高醫療質量。該技術可應用于脂肪肝、肝硬化、肝細胞癌、肝棘球蚴病、急性肝功能衰竭等[4]多種肝臟疾病的診療過程中,其模型效能已得到初步證實。本文將就機器學習在肝臟疾病的診斷分類、治療決策的選擇、臨床結局的評估等多方面應用進行系統綜述,為臨床醫師提供臨床診療經驗,也為機器學習應用于臨床實踐提供參考。
1 機器學習的概述
機器學習是一門多學科交叉的AI應用技術,涵蓋概率論、統計學、近似理論、復雜算法等,擅于優化程序、處理信息數據,以建立最佳的模型標準[5]。機器學習根據任務類型可分為監督學習、無監督學習、半監督學習和強化學習[6]。其常見的算法包括樸素貝葉斯(naive Bayes classifier,NB)、k-近鄰(k-nearest neighbors,KNN)、邏輯回歸(logistic regression,LR)、決策樹、隨機森林(random forest,RF)、梯度提升決策樹(gradient boosting decision tree,GBDT)、支持向量機(support vector machine,SVM)、人工神經網絡(artificial neural networks,ANN)等[7]。機器學習的優勢在于利用不同的算法去適應各種類型的數據,在計算機技術輔助下高效地處理大量數據信息,從而發現變量間的新模式及相關性并生成運算模型而被應用于各個領域。醫療領域存在復雜多樣的臨床數據分析需求,因此利用機器學習方法建立預測模型在臨床應用方面有著巨大前景。
2 機器學習在肝臟疾病中的應用
2.1 機器學習在肝臟疾病診斷及分類中的應用
機器學習通過納入患者的實驗室或影像學資料等,分析變量相關性,以算法擬合建立預測模型,從而對肝臟疾病進行早期診斷及分類。其優點在于減少了如內鏡檢查等侵入性操作,降低患者不適感,同時為患者能得到早期診治提供了先機。
2.1.1 在早期肝實質性病變中的應用
早期肝實質病變常見于肝臟慢性炎癥或長期代謝異常等所造成的肝損害。肝臟在病變早期能發揮代償作用,往往不會表現出明顯臨床癥狀,從而掩蓋病因。當肝臟功能處于失代償時,肝臟實質會進一步受損,此時容易出現各類并發癥。因此,越早識別肝臟病變及損害程度,就有望在早期阻止肝臟功能進一步損害。
Ji等[8]以及雷麗等[9]采用了機器學習方法來建立大規模人群中的脂肪肝病預測模型,其模型的曲線下面積(area under curve,AUC)均大于等于0.95,準確率接近于0.90。戴曉霞等[10]以及Lim等[11]利用機器學習方法成功建立了肝脂肪變性預測模型。這表明機器學習有著良好的診斷效果,可識別出肝臟早期病損。Wang等[12]開展了多中心前瞻性研究,納入1 990份患者的影像學資料,運用卷積神經網絡開發彈性成像影像組學模型以評估慢性乙型肝炎患者的肝纖維化程度,研究以肝活檢作為金標準,結果機器學習模型的AUC高達0.97。Hatami等[13]用KNN算法開發基于常規實驗室和臨床數據的評分系統,該研究表明模型在診斷不同程度的肝硬化腹水方面準確性達0.84。以上研究提示,用機器學習方法建立的肝硬化預測模型的準確率較高,在明確肝臟損害程度情況上與肝活檢評價效果相近。
機器學習在收集大量臨床數據的基礎上,分析變量關系,納入建模運算,構建脂肪肝、肝硬化等常見疾病的早期診斷模型,有助于篩查高危因素、進行早期治療。然而,對于重金屬蓄積所導致肝實質損害等少見的長期慢性肝損害的數據較少,因此建立機器學習模型較困難,未來有望通過大數據整理或算法更新彌補這一短板。
2.1.2 在肝臟腫瘤性病變中的應用
肝臟腫瘤性病變根據細胞異型性可分為良性和惡性,根據腫瘤的來源可分為原發性和繼發性,不同的類型對應了不同的治療方式,因此明確腫瘤具體分型分類尤為重要。
Mao等[14]收集了1 940份影像組學資料,采用LR等算法對肝癌進行分類,結果表明LR模型的AUC為0.82,準確度為0.84,可作為術前非侵入性方法區分原發性肝腫瘤和轉移性肝腫瘤。Oyama等[15]納入了原發性肝細胞癌、轉移性腫瘤和肝血管瘤患者的核磁共振圖像資料,選用紋理分析和同源拓撲數據分析,結果評估肝臟腫瘤分類的準確性高達92%。這都表明影像學組分析對肝臟腫瘤來源有良好的分類效果。胥生科等[16]對比采集肝癌、肝硬化和健康人的血清增強拉曼信號,運用主成分分析、線性判別分析、SVM、正交偏最小二乘判別分析等算法預測肝癌分類,其最佳分類效果的準確度達89.3%,敏感度為80.7%,特異度為93.2%,表明該研究成功建立了新型肝癌分類模型。結果證明,通過機器學習算法,利用臨床數據對腫瘤的分類是可行的。此外,Li等[17]通過研究結直腸癌肝轉移(colorectal cancer liver metastasis,CRLM)和非CRLM患者的影像組學信息,采用LR算法,其結果顯示AUC為0.75,表明模型對CRLM有良好的診斷能力。Yang等[18]基于肝臟成像報告及數據系統,納入116例病理確診的肝細胞癌微血管浸潤患者,將患者按1∶1比例隨機分配至訓練集和驗證集,以期建立機器學習識別模型;結果表明,LR模型驗證集的AUC為0.72,考慮其預測效果欠佳的原因在于運算數據樣本量過少,無法在交叉運算中修正參數,從而無法發揮機器學習的優勢。
以上研究證實,利用臨床數據建立機器學習模型從而進行肝臟腫瘤分類效果較好。其優勢在于保證診斷準確性的同時減少了一些侵入性操作,這在一定程度上降低了患者的不適感,然而該方法參與運算的局限性在于需大量臨床樣本量的支持。因此為減少模型誤差,提高預測準確率,預測模型的建立需要足量的臨床數據,這也增加了機器學習模型開展的難度。
2.1.3 在其他少見肝臟疾病中的應用
目前對于少見的肝臟疾病,有研究人員也利用機器學習方法對建立預測模型進行了嘗試。
張旭輝等[19]通過收集肝棘球蚴病患者的超聲聲像圖,并采用內核邏輯回歸與高斯核函數型支持向量機構建肝棘球蚴病分型模型,其AUC達0.88,表明超聲影像組學在診斷中發揮重要作用。許文瑤等[20]提取了泡型肝棘球蚴病(hepatic alveolar echinococcosis,HAE)患者的影像組學特征,建立XGBoost模型預測HAE邊緣浸潤帶情況,模型結果的AUC為0.94,表明其擁有良好的預測能力。
目前機器學習較少應用于少見肝臟疾病,原因在于少見疾病的發病率低、臨床資料不足,沒有足夠的樣本量支持機器學習運算與驗證。因此,更需要臨床醫師進一步發現和報道少見病例情況并分享病例資料,提高醫療領域對此類疾病的重視和了解。
2.2 機器學習在肝臟疾病治療決策中的應用
臨床醫師在患者診治過程中會面臨高風險的醫療決策的選擇,而根據研究表明,利用機器學習對現有臨床數據進行分析,有助于減少醫療風險,選擇最佳的治療方案[21]。
2.2.1 在有創治療決策中的應用
肝臟的有創治療存在著不可避免的操作風險。機器學習在分析臨床資料基礎上評估操作風險性,為醫師選擇治療方案提供了參考。
Jung等[22]納入小兒肝移植圍手術期臨床指標,將術前肝性腦病、手術結束時的鈉含量、肝動脈血栓和術后第7天的總膽紅素水平作為結局特征,采用ANN算法評估小兒肝移植90 d內的移植失敗風險,結果模型AUC為0.89,這為臨床醫生行小兒肝移植治療的決策時,需重點關注的指標提供了參考意見。Giglio等[23]收集了術前活體供肝數據,以機器學習方法對移植物重量匹配程度進行估計,結果顯示,模型平均絕對誤差值為50 g(標準差為62 g),平均絕對百分比誤差為10.3%,這為匹配肝移植供體的移植物提供了參考。Chen等[24]收集了肝移植手術患者的臨床數據,納入了天冬氨酸氨基轉移酶等多類變量進行運算,CatBoost模型的AUC為0.81,這為預測移植術中大量輸血的風險提供了經驗。Abajian等[25]研究介入治療肝細胞癌患者術后隨訪結果和基于圍手術期核磁共振資料的相關性,以預測經動脈化療栓塞的療效,其總體準確率為72%。嚴律南等[26]基于臨床檢驗數據、影像學數據,對肝癌患者采用GBDT建立肝癌臨床決策支持系統,經該系統計算后可立即給出治療方案;結果表明,手術切除準確率為95.2%,消融準確率為88.9%,介入準確率為94.1%,肝移植準確率為75.0%。
基于機器學習算法對治療后反饋的臨床資料進行分析,可明確在治療過程中的風險性,有助于臨床醫師于既往經驗或案例上做出合適的治療決策,從而降低醫療風險。
2.2.2 在無創治療決策中的應用
藥物治療是肝臟疾病中重要的無創治療方法。然而由于個體化差異,藥物在運用的過程中存在引起不良反應及肝毒性的風險。機器學習將藥物的性質、臨床療效和不良反應納入建模運算,為患者的藥物選擇提供參考建議。
Liu等[27]從DrugDex、DrugPoints和DailyMed數據庫中收集不同類型的藥物特征,提取包括急性肝功能衰竭等7種類型的肝不良反應作為終點變量,預測藥物性肝損傷(drug-induced liver injury,DILI)的發生。LR預測模型中,化學指紋圖譜和結合蛋白的AUC均在0.8以上,有助于醫師在同類藥品中選擇不良反應發生率低的藥物。Minerali等[28]參考了由FDA整理的DILIRank數據庫,結合DILI患者的數據,采用效果最佳的NB模型,其AUC為0.81,準確性為0.74,有助于個體化選擇藥物以減少DILI的發生。Kim等[29]選擇接受尼羅替尼治療的患者為研究對象,基于各項肝功能指標,開發機器學習模型來預測肝毒性發生的危險因素;研究表明,使用H2阻斷劑使尼羅替尼誘導的肝毒性風險降低,而男性和藥物的高劑量與肝毒性增加有關,這為個體化藥物選擇提供了經驗。
肝臟疾病應用治療藥物時,預防肝不良反應和肝毒性的發生尤為重要。機器學習方法有助于臨床醫師針對個體化情況制定以藥物為主的系統治療方案。然而,對于藥物數據的分析需要足夠大的樣本量且即時反饋新型藥物的臨床療效。因此,更需要制藥行業、生物醫學研究機構和臨床醫療機構進行藥物的數據共享。
2.3 機器學習在預測肝臟疾病臨床結局中的應用
隨著康復組學[30]概念的興起,患者臨床結局成為治療的關注重點[31]。機器學習整合患者的多項隨訪資料,綜合判斷患者的預后情況,為早期制定康復治療計劃提供寶貴的經驗。
2.3.1 評估腫瘤性病變的預后
肝臟腫瘤具有良性腫瘤惡變、惡性腫瘤復發轉移等生物學特性,因此肝腫瘤患者需要接受定期隨訪。機器學習通過對患者治療期間的數據分析,篩選出術后不良預后的高危人群,有利于在隨訪中做到早發現早治療。
Saillard等[32]研究行手術切除治療的肝細胞癌患者數據,基于全切片數字化組織學切片進行深度學習運算,以卷積神經網絡提取特征,建立患者生存模型,其中“SCHMOWDER”和“CHOWDER”模型生存預測的風險分數一致性指數(C-indexes)分別達到0.78和0.75,高于與生存相關的所有基線變量的綜合評分,為組織病理學數據預測肝細胞癌預后情況提供了經驗,研究表明腫瘤情況可以指導預后評估及后續治療。Liu等[33]基于肝癌患者治療期間的臨床數據,構建梯度促進生存模型來預測患者的臨床結局,其C-indexes均在0.8以上;同時該研究制定了預后風險分組標準,表明高風險分數與臨床預后不良結局呈正相關。Wang等[34]納入肝細胞癌患者的臨床數據,探究術后死亡情況,RF模型的AUC為0.80,精確度為0.73。Jolissaint等[35]納入肝內膽管癌手術患者進行回顧性研究,結合影像組學特征,采用機器學習方法對腫瘤病灶切除后的復發情況進行預測,結果表明腫瘤大小等特征預測復發情況的AUC為0.84,為影像組學和機器學習評估腫瘤復發提供了參考經驗。同時,這也提醒臨床醫師在腫瘤后續治療中應結合分期情況及時調整治療方案。崔金濤等[36]以腹腔鏡肝血管瘤切除術患者作為研究對象,探討釓塞酸二鈉增強MRI影像組學對手術療效及結局的預測價值,其logistic回歸中模型訓練集的AUC大于等于0.8,研究表明根據術中腹腔鏡肝血管瘤情況能夠預測出術后療效。
機器學習通過納入包括生化代謝物的改變、影像學資料等建立預后模型運算,分析治療期間臨床資料與預后情況的相關性,為幫助患者調整隨訪策略并改善未來預后提供了參考。
2.3.2 評估非腫瘤性病變的預后
非腫瘤性病變的定期隨訪檢查,有利于判斷治療的效果以及自身肝臟情況,避免隱藏病情的進展或惡化。機器學習通過患者臨床數據構建模型,預測疾病進展和預后,有利于明確治療效果。
Guo等[37]研究了肝硬化患者住院期間的臨床數據,采用深度神經網絡探究患者臨床指標與臨床結局的關系,該模型預測90 d、180 d和365 d死亡率的AUC分別達到0.88、0.86和0.85,且研究發現堿性磷酸酶、丙氨酸氨基轉移酶和血紅蛋白水平與患者臨床結局密切相關。Park等[38]研究了丙型肝炎病毒(HCV)感染患者病毒載量等臨床實驗室資料,采用梯度提升機以預測HCV感染者的抗病毒療效情況,結果C-indexes為0.69,這有助于篩選抗病毒效果欠佳的相關因素。Tonon等[39]采用極端梯度提升交叉驗證模型算法,建立急性肝功能衰竭患者30 d的死亡預測模型,該模型的AUC為0.88,該研究為運用臨床參數預測急性肝臟疾病患者的預后提供了經驗。
3 展望
綜上所述,機器學習在肝臟疾病領域的臨床應用取得了良好的效果,并且在針對疾病的診斷、治療、預后等多方面有著巨大潛力。基于臨床數據,采用機器學習方法建立預測模型,有助于篩選高危人群、預測疾病進展、給予個體化治療方案、調整治療策略、明確治療效果。機器學習作為新興人工智能技術,在提高醫療服務水平和改善患者生存質量方面有著巨大的前景。然而,建立機器學習模型仍需克服一些難點。第一,模型需要足夠大的樣本量進行運算與修正,以最大程度減少數據偏倚及建模誤差。第二,不同實驗室儀器設備及診斷標準可能導致各項結果存在差異。第三,預測效果需經長期臨床驗證,以確保計算機運算結果與生物學機制相符合。第四,人工智能機器學習應用于醫療領域需要涉及個人信息,因此在隱私保護和知情同意方面需要進一步完善標準和制度。隨著技術日益成熟、信息不斷豐富、標準和制度更加完善,機器學習技術在肝臟疾病領域的應用將會向更科學和更高效的方向前進,以期提高醫療服務的水平和質量。
重要聲明
利益沖突聲明:作者之間無利益沖突。
作者貢獻聲明:戴宗林負責文章整體構思、文獻檢索、起草及修改稿件;梁宇鑫和劉易隴負責起草及修改稿件;黃孝倫負責文章的指導及審核。