引用本文: 宋彬, 黃子星. 人工智能在影像學的發展、現狀及展望. 中國普外基礎與臨床雜志, 2018, 25(5): 523-527. doi: 10.7507/1007-9424.201804080 復制
醫療數據中有 90% 來自于醫學影像[1],并且醫學影像數據還在逐年增長,然而放射科醫生的增長速度和工作效率不足以應對這樣的數據增長趨勢。今天的放射科醫生每天都被大量的影像數據所困擾,面臨巨大的壓力。影像成像設備和技術的發展也推動了影像學的進步,其進步包括獲取更高分辨率圖像的能力,使更小的解剖結構和異常可視化。更高分辨率圖像是以增加每位患者的平均圖像數量而獲得的。隨著影像圖像數量的大量增加,而放射科醫生未見大量增加,因而需要增加更多的工作量來解讀這些圖像,一方面,這些圖像復雜、數量龐大,遠可能超過放射科醫生解釋它們的能力;另一方面,目前大部分醫學影像數據仍然需要人工分析,疲勞、分心、圖像質量、病變細微且復雜等都會影響到放射醫生對疾病的診斷。
人工智能(artificial intelligence)的概念在 1956 年首次被提出來[2],是一門包括計算機科學、數學等多種學科在內的新的技術科學,其研究開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統。隨著影像成像技術和計算機技術的進步,二者有機結合,促使人工智能在各種影像任務如風險評估、檢測、診斷、預后和治療反應中的潛在使用價值迅速增加。
現就人工智能在影像學領域的發展歷程、目前研究應用最多的領域如計算機輔助診斷系統、影像組學和影像基因組學、機器學習等方面做一簡要介紹以及對未來進行展望。
1 計算機輔助診斷系統
計算機輔助診斷系統是作為一個特定的人工智能領域開發的,已經發展了幾十年,它是使用圖像輸入來得出關于潛在異常的結論或提供鑒別診斷[3-4]。他們將來自圖像處理、計算機視覺和醫學圖像分析的數據驅動特征提取方法與推理規則結合起來,推斷圖像中包含潛在異常的區域。
計算機輔助診斷系統分為計算機輔助檢測和計算機輔助診斷,計算機輔助檢測重點是檢測,計算機只需要對異常征象進行標注,在此基礎上進行常見的影像處理,并無需進行進一步診斷[5-6],只是簡單地指出潛在的異常情況,并允許半自動測量計算[3, 7]。計算機輔助診斷是計算機輔助檢測的延伸和最終目的。
計算機輔助檢測系統已經商業化,并且自世紀之交以來一直在臨床上開發并使用,尤其是在胸部和乳腺影像中[8-13]。在過去的幾十年中,研究人員一直在開發計算機輔助診斷的圖像分析方法,如計算機輔助定量描述臨床圖像上的乳腺病變以及評估癌癥風險[11]。
無論是計算機輔助檢測還是計算機輔助診斷,人工智能仍然采用基于規則的推理原則,并根據系統中內置的先驗規則進行推導,并應用于單個患者的數據。
最近的計算機輔助診斷系統使用機器學習來進行基于特征的分類,而更新的方法也使用了深度學習[7]。盡管最初的計算機輔助診斷系統是基于規則的,但現在的計算機輔助診斷系統基本都是在提供了充足的訓練圖像之后,采用某種機器學習方法將候選區域分為正常或異常。
關于計算機算法和特定的影像學闡釋,沒有一種萬能的方法能適應所有的情況。每種計算機圖像分析方法都需要特定于該任務的定制以及成像模式,比如在乳腺癌風險評估中,計算機提取的是乳腺密度或乳腺實質類型特征,以此來分析其與乳腺癌危險因素的關系[14-19]。
2 影像組學和影像基因組學
2.1 影像組學
疾病的有效診斷和治療依賴于來自涉及臨床、影像、實驗室、分子、基因組數據等多個信息的整合,即各種組合“-omics”。
傳統的醫學影像模式是基于 CT、MRI、超聲等醫學成像,主要依靠形態學診斷和評價疾病,提供一些主觀的、半定量的信息,很少能提供精準醫療所需要的功能、分子與基因水平的生物學信息,不能提供個性化生物和靶向治療所需要的信息。
隨著精準醫學的提出和發展,影像設備生成的圖像數據量越來越大,除了包含常規的解剖學征象外,還包含了極其豐富的數字化信息。為了能使這些信息得以進行處理和使用,影像組學(radiomics)應運而生。
影像組學是計算機輔助診斷的擴展,它大量應用自動化數據特征化算法,將感興趣區域內的影像數據轉化為具有高分辨率的、可發掘的特征空間數據[20-22]。影像組學具有直觀的特征或深入學習的特征,強調影像生物標志物的定量,其基于圖像為精準醫學提供了疾病表征的預測,并且基于圖像提供表征的定量,可用于與其他組學相關的數據挖掘。近年來,關于影像組學研究發表的論文數量急劇增加,超過計算機輔助診斷系統[20]。
腫瘤在空間上是異質性的,而現在許多腫瘤的影像生物標志物僅包括大小和簡單的增強特點,無法證明其異質性;而影像組學研究已經從各種影像上證明了腫瘤的異質性,如乳腺癌和肺癌。影像組學可以獲得腫瘤的基于圖像的表征,包括大小、形狀、邊緣形態、強化紋理、動力學和方差動力學表型,如乳腺癌的強化紋理表型表征了增強造影后的腫瘤紋理模式,因此其定量表征了乳房腫瘤內造影劑攝取的異質性;增強紋理熵越大,腫瘤內的紋理模式越不均勻,這可能反映了血管生成和治療敏感性的異質性[23-25]。
2.2 影像基因組學
基于影像表型和基因組學之間的關系,近年來癌癥研究出現了一個新的研究方向—影像基因組學(radiogenomics)[26]。
影像基因組學提供一種實用的方法來利用有限和不完整的數據,生成可能導致決策制定改善的知識,從而改善患者結果。
進行影像基因組學分析,需從圖像中提取特定的特征,可以由放射科醫師或其他合格的個人完成提取,或者在計算機程序的輔助下進行提取[27-28]。
一項典型的放射基因組學研究涉及手動或半自動評估成像特征及其與單個基因表達的相關性、組合基因表達模式如先前定義的基因組亞型和其他分子表型。有研究者[29]在乳腺癌小樣本量的研究中顯示了影像與基因組學之間有關聯。隨后有研究發現了對 MRI 增強動力學半自動提取的成像特征與 Luminal A、Luminal B 亞型[30-31]以及 Oncotype DX 公司的基因表達檢測結果[32-33]之間的關系。目前已發表的研究成果的不足之處在于樣本量通常較小(<100),這限制了結論的可靠性。
3 機器學習
人工智能的一個主要組成部分是機器學習,它使計算機無需明確編程即可學習,這種學習技術結合了與我們的大腦生物神經網絡的結構和功能類似的計算模型和算法,這些計算模型通常被稱為人工神經網絡(artificial neural networks)。當這些人工神經網絡處理來自大量輸入流的信息(數字數據)時,它們有能力“學習”并改變它們的結構,就像我們的大腦神經元被記憶改變了一樣。
機器學習算法分析數據特征作為輸入,通過迭代改進的過程可以產生線性和非線性的預測模型,檢測信號、分類模式或預測結果[34-35],其可以根據不同的原理組織成不同的分類,如根據培訓樣本標簽的使用情況,它們可以分為監督學習算法、半監督學習算法和無監督學習算法[35]。
機器學習算法有很多種,包括人工神經網絡、支持向量機(support vector machines)、k 最近鄰(k-nearest neighbors)和隨機森林(random forest)。最近,人們對多層或深層的人工神經網絡產生了興趣,因為它們能夠很好地處理復雜和高維的數據集[36]。
機器學習的成功特別是人工神經網絡的成功可以歸因于 3 個主要因素:① 對大數據的處理能力增強,常規數據分析的能力是不能處理非常龐大的數據集的;② 圖形處理器技術的進步,具備了必要的并行處理能力,這有助于訓練機器學習算法;③ 用于數據訓練的先進的深度算法和優化技術的發展[37-38]。
4 深度學習
深度學習是機器學習的一個子類別,它使用多層網絡來評估原始成像輸入數據中的復雜模式,其是基于數據學習事物表征,如識別特征圖像。由于深度學習能夠識別圖像中的物體,因此,它與影像學有很大關系。
目前使用最多的深度學習方法是卷積神經網絡(convolutional neural networks)。盡管卷積神經網絡已經在計算機輔助檢測中使用相當長一段時間,20 世紀 90 年代就有將卷積神經網絡用于影像學的應用,如計算機檢測乳腺鉬靶中的微鈣化[39]以及在乳腺鉬靶上區分腫塊和正常組織[40]。但計算機技術的進步尤其是圖形處理器的進步使得卷積神經網絡內的層數急劇增加,從而產生了“深度”(deep)的概念[41-42]。
近年來,在深度學習方面取得的進展相當引人注目,其中的卷積神經網絡在許多基準圖像分類任務中取得了巨大成功[43-44]。然而,卷積神經網絡需要非常大量且標記正確的數據集以及大量的計算資源。因此,在醫療決策中實施深度學習可以通過使用預先訓練卷積神經網絡來進行。
一般來說,計算機輔助診斷系統和其他醫學圖像闡釋通常不可能從頭開始培訓卷積神經網絡,因此通用特征可以從已訓練的卷積神經網絡遷移出來,以作為用于輸入到影像任務的分類器的特征,這就是遷移學習(transfer learning)[45-48]。
目前,已經有不少研究報道了遷移學習在影像學中的作用,如在日常物體上預先訓練的現成卷積神經網絡,可以用來描述乳腺圖像上的腫瘤[49-50],完成將知識從一般對象識別任務轉移到醫學成像分類任務;研究人員還可以對已經訓練好的卷積神經網絡進行微調,只使用訓練好的卷積神經網絡一部分去處理不同的任務,并專門針對新任務重新訓練卷積神經網絡的后續層。這些方法允許利用深度神經網絡的預測能力,而不需要非常大的數據集或計算成本要求。
5 展望
影像學在推動醫學進入數字化時代方面發揮了主導作用,現在有機會成為探索人工智能醫學應用的先驅者。當前以數字形式存檔的數以千萬計的影像學報告和數十億張圖像,體現了“大數據(big data)”的概念, 構成了人工智能研究所需的基礎。
以下幾個方面將有助于未來的人工智能影像研究:① 國家和國際影像共享網絡;② 可用于測試和比較人工智能程序的參考病例(已有臨床結果)數據集;③ 滿足人工智能應用的成像協議的標準化;④ 用于描述和報告人工智能應用程序的通用詞典。
人工智能的根本問題是放射科的人工智能應用是否可以增加價值,其包括:發現新知識,從影像檢查中提取更多、更好的信息,以更低的成本為患者取得更好的結果,為放射科醫師建立更加高效的工作流程和提高工作滿意度。
隨著醫療保健數據的日益普及和大數據分析方法的迅速發展,使人工智能在醫療保健領域的成功應用成為可能。在相關的臨床問題的指導下,強大的人工智能技術可以解開大量數據中隱藏的臨床相關信息,進而有助于臨床決策的制定,具體而言就是用人工智能去解決影像鏈與臨床應用鏈的問題(圖 1),其中的影像鏈指影像醫學的技術支撐,包括圖像采集與圖像后處理、數據挖掘;臨床應用鏈指影像信息在臨床的應用,包括了疾病篩查與早期診斷、預測、治療、療效評估與監測。

現在有一種言論在討論人工智能醫生是否最終將取代人類醫生在未來。我們相信,在可預見的將來,人類醫生將不會被機器所取代,但是人工智能絕對可以幫助醫生在影像學的某些功能領域做出更好的臨床決策,甚至取代人的判斷。
醫療數據中有 90% 來自于醫學影像[1],并且醫學影像數據還在逐年增長,然而放射科醫生的增長速度和工作效率不足以應對這樣的數據增長趨勢。今天的放射科醫生每天都被大量的影像數據所困擾,面臨巨大的壓力。影像成像設備和技術的發展也推動了影像學的進步,其進步包括獲取更高分辨率圖像的能力,使更小的解剖結構和異常可視化。更高分辨率圖像是以增加每位患者的平均圖像數量而獲得的。隨著影像圖像數量的大量增加,而放射科醫生未見大量增加,因而需要增加更多的工作量來解讀這些圖像,一方面,這些圖像復雜、數量龐大,遠可能超過放射科醫生解釋它們的能力;另一方面,目前大部分醫學影像數據仍然需要人工分析,疲勞、分心、圖像質量、病變細微且復雜等都會影響到放射醫生對疾病的診斷。
人工智能(artificial intelligence)的概念在 1956 年首次被提出來[2],是一門包括計算機科學、數學等多種學科在內的新的技術科學,其研究開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統。隨著影像成像技術和計算機技術的進步,二者有機結合,促使人工智能在各種影像任務如風險評估、檢測、診斷、預后和治療反應中的潛在使用價值迅速增加。
現就人工智能在影像學領域的發展歷程、目前研究應用最多的領域如計算機輔助診斷系統、影像組學和影像基因組學、機器學習等方面做一簡要介紹以及對未來進行展望。
1 計算機輔助診斷系統
計算機輔助診斷系統是作為一個特定的人工智能領域開發的,已經發展了幾十年,它是使用圖像輸入來得出關于潛在異常的結論或提供鑒別診斷[3-4]。他們將來自圖像處理、計算機視覺和醫學圖像分析的數據驅動特征提取方法與推理規則結合起來,推斷圖像中包含潛在異常的區域。
計算機輔助診斷系統分為計算機輔助檢測和計算機輔助診斷,計算機輔助檢測重點是檢測,計算機只需要對異常征象進行標注,在此基礎上進行常見的影像處理,并無需進行進一步診斷[5-6],只是簡單地指出潛在的異常情況,并允許半自動測量計算[3, 7]。計算機輔助診斷是計算機輔助檢測的延伸和最終目的。
計算機輔助檢測系統已經商業化,并且自世紀之交以來一直在臨床上開發并使用,尤其是在胸部和乳腺影像中[8-13]。在過去的幾十年中,研究人員一直在開發計算機輔助診斷的圖像分析方法,如計算機輔助定量描述臨床圖像上的乳腺病變以及評估癌癥風險[11]。
無論是計算機輔助檢測還是計算機輔助診斷,人工智能仍然采用基于規則的推理原則,并根據系統中內置的先驗規則進行推導,并應用于單個患者的數據。
最近的計算機輔助診斷系統使用機器學習來進行基于特征的分類,而更新的方法也使用了深度學習[7]。盡管最初的計算機輔助診斷系統是基于規則的,但現在的計算機輔助診斷系統基本都是在提供了充足的訓練圖像之后,采用某種機器學習方法將候選區域分為正常或異常。
關于計算機算法和特定的影像學闡釋,沒有一種萬能的方法能適應所有的情況。每種計算機圖像分析方法都需要特定于該任務的定制以及成像模式,比如在乳腺癌風險評估中,計算機提取的是乳腺密度或乳腺實質類型特征,以此來分析其與乳腺癌危險因素的關系[14-19]。
2 影像組學和影像基因組學
2.1 影像組學
疾病的有效診斷和治療依賴于來自涉及臨床、影像、實驗室、分子、基因組數據等多個信息的整合,即各種組合“-omics”。
傳統的醫學影像模式是基于 CT、MRI、超聲等醫學成像,主要依靠形態學診斷和評價疾病,提供一些主觀的、半定量的信息,很少能提供精準醫療所需要的功能、分子與基因水平的生物學信息,不能提供個性化生物和靶向治療所需要的信息。
隨著精準醫學的提出和發展,影像設備生成的圖像數據量越來越大,除了包含常規的解剖學征象外,還包含了極其豐富的數字化信息。為了能使這些信息得以進行處理和使用,影像組學(radiomics)應運而生。
影像組學是計算機輔助診斷的擴展,它大量應用自動化數據特征化算法,將感興趣區域內的影像數據轉化為具有高分辨率的、可發掘的特征空間數據[20-22]。影像組學具有直觀的特征或深入學習的特征,強調影像生物標志物的定量,其基于圖像為精準醫學提供了疾病表征的預測,并且基于圖像提供表征的定量,可用于與其他組學相關的數據挖掘。近年來,關于影像組學研究發表的論文數量急劇增加,超過計算機輔助診斷系統[20]。
腫瘤在空間上是異質性的,而現在許多腫瘤的影像生物標志物僅包括大小和簡單的增強特點,無法證明其異質性;而影像組學研究已經從各種影像上證明了腫瘤的異質性,如乳腺癌和肺癌。影像組學可以獲得腫瘤的基于圖像的表征,包括大小、形狀、邊緣形態、強化紋理、動力學和方差動力學表型,如乳腺癌的強化紋理表型表征了增強造影后的腫瘤紋理模式,因此其定量表征了乳房腫瘤內造影劑攝取的異質性;增強紋理熵越大,腫瘤內的紋理模式越不均勻,這可能反映了血管生成和治療敏感性的異質性[23-25]。
2.2 影像基因組學
基于影像表型和基因組學之間的關系,近年來癌癥研究出現了一個新的研究方向—影像基因組學(radiogenomics)[26]。
影像基因組學提供一種實用的方法來利用有限和不完整的數據,生成可能導致決策制定改善的知識,從而改善患者結果。
進行影像基因組學分析,需從圖像中提取特定的特征,可以由放射科醫師或其他合格的個人完成提取,或者在計算機程序的輔助下進行提取[27-28]。
一項典型的放射基因組學研究涉及手動或半自動評估成像特征及其與單個基因表達的相關性、組合基因表達模式如先前定義的基因組亞型和其他分子表型。有研究者[29]在乳腺癌小樣本量的研究中顯示了影像與基因組學之間有關聯。隨后有研究發現了對 MRI 增強動力學半自動提取的成像特征與 Luminal A、Luminal B 亞型[30-31]以及 Oncotype DX 公司的基因表達檢測結果[32-33]之間的關系。目前已發表的研究成果的不足之處在于樣本量通常較小(<100),這限制了結論的可靠性。
3 機器學習
人工智能的一個主要組成部分是機器學習,它使計算機無需明確編程即可學習,這種學習技術結合了與我們的大腦生物神經網絡的結構和功能類似的計算模型和算法,這些計算模型通常被稱為人工神經網絡(artificial neural networks)。當這些人工神經網絡處理來自大量輸入流的信息(數字數據)時,它們有能力“學習”并改變它們的結構,就像我們的大腦神經元被記憶改變了一樣。
機器學習算法分析數據特征作為輸入,通過迭代改進的過程可以產生線性和非線性的預測模型,檢測信號、分類模式或預測結果[34-35],其可以根據不同的原理組織成不同的分類,如根據培訓樣本標簽的使用情況,它們可以分為監督學習算法、半監督學習算法和無監督學習算法[35]。
機器學習算法有很多種,包括人工神經網絡、支持向量機(support vector machines)、k 最近鄰(k-nearest neighbors)和隨機森林(random forest)。最近,人們對多層或深層的人工神經網絡產生了興趣,因為它們能夠很好地處理復雜和高維的數據集[36]。
機器學習的成功特別是人工神經網絡的成功可以歸因于 3 個主要因素:① 對大數據的處理能力增強,常規數據分析的能力是不能處理非常龐大的數據集的;② 圖形處理器技術的進步,具備了必要的并行處理能力,這有助于訓練機器學習算法;③ 用于數據訓練的先進的深度算法和優化技術的發展[37-38]。
4 深度學習
深度學習是機器學習的一個子類別,它使用多層網絡來評估原始成像輸入數據中的復雜模式,其是基于數據學習事物表征,如識別特征圖像。由于深度學習能夠識別圖像中的物體,因此,它與影像學有很大關系。
目前使用最多的深度學習方法是卷積神經網絡(convolutional neural networks)。盡管卷積神經網絡已經在計算機輔助檢測中使用相當長一段時間,20 世紀 90 年代就有將卷積神經網絡用于影像學的應用,如計算機檢測乳腺鉬靶中的微鈣化[39]以及在乳腺鉬靶上區分腫塊和正常組織[40]。但計算機技術的進步尤其是圖形處理器的進步使得卷積神經網絡內的層數急劇增加,從而產生了“深度”(deep)的概念[41-42]。
近年來,在深度學習方面取得的進展相當引人注目,其中的卷積神經網絡在許多基準圖像分類任務中取得了巨大成功[43-44]。然而,卷積神經網絡需要非常大量且標記正確的數據集以及大量的計算資源。因此,在醫療決策中實施深度學習可以通過使用預先訓練卷積神經網絡來進行。
一般來說,計算機輔助診斷系統和其他醫學圖像闡釋通常不可能從頭開始培訓卷積神經網絡,因此通用特征可以從已訓練的卷積神經網絡遷移出來,以作為用于輸入到影像任務的分類器的特征,這就是遷移學習(transfer learning)[45-48]。
目前,已經有不少研究報道了遷移學習在影像學中的作用,如在日常物體上預先訓練的現成卷積神經網絡,可以用來描述乳腺圖像上的腫瘤[49-50],完成將知識從一般對象識別任務轉移到醫學成像分類任務;研究人員還可以對已經訓練好的卷積神經網絡進行微調,只使用訓練好的卷積神經網絡一部分去處理不同的任務,并專門針對新任務重新訓練卷積神經網絡的后續層。這些方法允許利用深度神經網絡的預測能力,而不需要非常大的數據集或計算成本要求。
5 展望
影像學在推動醫學進入數字化時代方面發揮了主導作用,現在有機會成為探索人工智能醫學應用的先驅者。當前以數字形式存檔的數以千萬計的影像學報告和數十億張圖像,體現了“大數據(big data)”的概念, 構成了人工智能研究所需的基礎。
以下幾個方面將有助于未來的人工智能影像研究:① 國家和國際影像共享網絡;② 可用于測試和比較人工智能程序的參考病例(已有臨床結果)數據集;③ 滿足人工智能應用的成像協議的標準化;④ 用于描述和報告人工智能應用程序的通用詞典。
人工智能的根本問題是放射科的人工智能應用是否可以增加價值,其包括:發現新知識,從影像檢查中提取更多、更好的信息,以更低的成本為患者取得更好的結果,為放射科醫師建立更加高效的工作流程和提高工作滿意度。
隨著醫療保健數據的日益普及和大數據分析方法的迅速發展,使人工智能在醫療保健領域的成功應用成為可能。在相關的臨床問題的指導下,強大的人工智能技術可以解開大量數據中隱藏的臨床相關信息,進而有助于臨床決策的制定,具體而言就是用人工智能去解決影像鏈與臨床應用鏈的問題(圖 1),其中的影像鏈指影像醫學的技術支撐,包括圖像采集與圖像后處理、數據挖掘;臨床應用鏈指影像信息在臨床的應用,包括了疾病篩查與早期診斷、預測、治療、療效評估與監測。

現在有一種言論在討論人工智能醫生是否最終將取代人類醫生在未來。我們相信,在可預見的將來,人類醫生將不會被機器所取代,但是人工智能絕對可以幫助醫生在影像學的某些功能領域做出更好的臨床決策,甚至取代人的判斷。