引用本文: 陳敬禮, 王國榮. 單細胞測序技術在結直腸癌肝轉移中的應用. 中國普外基礎與臨床雜志, 2023, 30(6): 745-750. doi: 10.7507/1007-9424.202301046 復制
結直腸癌(colorectal cancer,CRC)是目前最常見的消化道惡性腫瘤之一,根據最新癌癥統計結果,CRC是位居前列腺(男性)或乳腺癌(女性)和肺癌之后的第四大常見惡性腫瘤[1]。CRC患者中,近一半會出現同時性或異時性的肝臟轉移[2],其中25%的CRC患者在其初診時即出現肝轉移[3],嚴重影響CRC患者的預后,故結直腸癌肝轉移(colorectal cancer liver metastasis,CRLM)是近年我國結直腸領域的研究熱點。在既往基于腫瘤組織測序和組學的研究中,因腫瘤細胞的高度異質性,可能錯失了大量的重要信息。近幾年隨著單細胞測序(single cell sequencing,SCS)技術的發展,消除了普通測序技術的一些弊端,使得SCS成為我們探究腫瘤細胞異質性的最好途徑[4]。SCS技術對探究腫瘤異質性和腫瘤發生、發展相關分子機制有著重要意義,能夠幫助我們找到新的腫瘤標志物、治療靶點及預測分子,使廣大患者從中受益。現就有關SCS技術在CRLM中應用的研究進展作一綜述,以提高我們對SCS和CRLM的認識。
1 測序技術的起源和進步
從Sanger等[5]發明了第一代基因測序技術和 Gilbert團隊[6]發明的“化學測序法”開始,測序技術逐漸成為探索基因層面奧秘的有效方法。Sanger測序法的基本原理是在反應體系加入雙脫氧核苷三磷酸,使得DNA聚合酶識別并聚合到3′端后,DNA鏈終止延伸,最后將反應體系分別進行電泳分析及放射自顯影,從而得到DNA的堿基序列。化學測序法通過特殊化學試劑來修飾DNA的堿基,使得DNA鏈在特定位置中斷,最終通過凝膠電泳和放射自顯影技術分析測序片段。但這兩種方法由于其程序復雜、通量低、成本高、數據產出較低等問題難以在臨床上大規模應用。此后第二代測序技術通過通用引物來定位DNA分子核酸序列信息,該技術相比一代測序技術大幅度降低了測序成本,因其高通量的特點使得基因測序從單個位點進階到全基因組層面,主要包括illumina測序和454-Roche測序。二代測序技術將基因擴增、堿基測序與數據收集3個步驟同步進行,能夠同時獲得數千至數十億條DNA模板的測序結果[7]。二代測序技術雖然通量有所提高,但其測序序列讀長較短,無法實現全基因組覆蓋且難以檢測和表征結構變異。在此背景下,出現了以單分子測序技術發展為基礎的第三代測序技術,該技術不需要擴增DNA就可以直接測序,不僅通量更高,而且克服了讀長限制,能夠實現全基因組覆蓋,可以直接檢測本地DNA的表觀遺傳修飾[8]。但三代測序對樣本核酸質量要求很高,且其測序錯誤率和成本仍相對較高,無法完全取代二代測序。
然而,上述測序技術多局限于器官與組織群體細胞的檢測,其表達水平可能受到異質性的影響。近年來出現的SCS技術,將單細胞分離技術、核酸擴增技術及高通量測序技術相融合,有效地彌補了上述不足,可用于發現多個細胞之間的進化關系,進而揭示腫瘤細胞存在的異質性,成為了目前細胞生物學分析的重要工具[9]。通過對SCS結果的分析,不僅能揭示腫瘤內細胞異質性,還能有效區分腫瘤組織中的多種細胞亞型,進而有利于對腫瘤發生、發展、轉移、耐藥和免疫逃逸相關機制的研究[10]。
1.1 SCS的技術原理
SCS技術是在單細胞水平通過均勻擴增單一細胞的遺傳物質,標記建庫后進行測序,最后對單個細胞全基因組的測序結果展開數據分析。其流程主要有以下4個步驟:① 單細胞分離;② 細胞溶解與獲取遺傳物質;③ 全基因組擴增;④ 測序與數據分析。
分離單個細胞是進行各種SCS的首要步驟,主要方法有連續稀釋法、流式細胞術、電泳細胞分離技術、微流控技術、激光捕獲顯微切割術等。組織經單細胞分離溶解之后,需提取單個細胞的微量基因進行基因擴增,構建基因文庫以達到后續測序的目的。目前主要的基因擴增方法包括多重退火環狀循環擴增、多重置換擴增、退行性寡核苷酸聚合酶鏈反應等。其中,多重置換擴增因其對全基因組的覆蓋率最高常用于檢測單核苷酸的突變,而退行性寡核苷酸聚合酶鏈反應和多重退火環狀循環擴增對基因組擴增的均一性更好,常用于檢測基因拷貝數變異[11]。SCS主要包括先擴增再測序的第二代高通量測序和不需擴增直接測序的第三代高通量測序,其中第二代測序具有成本較低和測序效率較高的特點,而第三代測序是一種不依賴PCR擴增技術的單分子測序技術,能夠避免PCR擴增產生的誤差且效率更高[12]。進行數據分析時需要對測序原始數據生成特定格式(Fastq格式)進行質量控制,基于特異分子標簽(unique molecular identifiers,UMI)總數和檢測到的基因數等過濾掉不合格的數據,然后根據細胞特異性標簽,將拆解后的測序數據構建成單細胞基因表達矩陣用于下游分析[13]。 基因水平分析與細胞水平分析是SCS數據下游分析的兩個方向,基因水平分析主要用于基因的富集分析、調控網絡以及尋找差異表達基因等方向,而細胞水平分析主要體現在聚類分析和軌跡推斷。
1.2 SCS的技術分類
SCS主要包括單細胞基因組測序(single cell DNA sequencing,scDNA-seq)、單細胞轉錄組測序(single cell RNA sequencing,scRNA-seq)和單細胞表觀組測序(single cell epigenome sequencing),這3種測序類型能夠從不同層面來揭示細胞各個階段的特性和功能[14]。近年來,SCS技術不斷發展,陸續出現了一批以單組學技術發展為基礎的單細胞多組學技術(single-cell multi-omics sequencing,scCOOL-Seq) [15],這些多組學測序技術能夠捕獲同一細胞的轉錄組、基因組和表觀基因組在內的多種信息,從而使我們能夠在單細胞分辨率上展開全面聯合分析。
1.2.1 單細胞基因組測序技術
單細胞基因組測序技術是在單細胞分離、溶解后,通過擴增所獲取的微量全基因組DNA以獲得高覆蓋率的完整基因組,進而進行高通量測序和數據分析。單細胞基因組測序可以揭示以前在不同研究領域無法解決的生物學問題,包括體細胞突變、生物發育、基因組功能、微生物學等[16]。尤其在腫瘤方面,可以獲得癌細胞的特定突變來源及突變頻率,以及區分腫瘤的發展、演化、轉移過程中的突變,進而探究細胞的進化關系和群體差異[17]。
1.2.2 單細胞轉錄組測序技術
單細胞轉錄組測序技術是在單細胞分離、溶解后,提取單細胞中的RNA,將捕獲的mRNA反轉錄為cDNA,然后通過PCR技術或其他轉錄方法擴增整個轉錄組,最后再進行測序和文庫構建[18],這種測序技術不僅可以確切地檢測出細胞中的動態基因表達及調控信息,還能準確區分不同發育階段細胞的類型和狀態[19],在揭示組織組成、基因間調控關系和轉錄動力學方面具有重要作用。
1.2.3 單細胞表觀組測序技術
表觀遺傳是指DNA序列改變之外的基因表達及調控的可遺傳改變,主要包括DNA/RNA甲基化、染色質的重塑和三維空間構象、組蛋白修飾等,它們在生物體的基因表達調控中同樣起著重要作用[20]。 單細胞表觀組測序可以補充基因組和轉錄組測序,提供洞察細胞類型特定的基因表達調控,對研究表觀遺傳學的時空特異性具有重要價值[14]。 近幾十年來,結合位點分析法—染色質免疫沉淀后測序(chromatin immunoprecipitation followed by sequencing,ChIP-SEQ)方法幾乎是表觀基因組分析的唯一方法,然而,這種方法是一種基于免疫沉淀的技術,在回收與目標蛋白結合的基因組DNA方面通常效率不高[21]。隨后不依賴于免疫沉淀的測序技術被開發出來,可以在單細胞水平上進行表觀基因組分析,其中包括染色質整合標記測序(chromatin integration labeling sequencing,Chil-Seq)、靶下切割和標記(cleavage under targets and tagmentation,Cut&Tag)技術和單細胞免疫切割測序(single-cell immunocleavage sequencing,Chic-Seq)。
1.2.4 單細胞多組學技術
相較于利用不同的單細胞單組學測序方法從單個細胞中分別獲取轉錄組、基因組、表觀遺傳組等進行分析,單細胞多組學測序技術(single-cell multi-omics sequencing,scCOOL-Seq)可以從同一個單細胞中同時獲取多種組學數據,因而可以更好地反映細胞在特定狀態下各組學間的關聯以及復雜的分子調控網絡[22]。例如,基因組與轉錄組組合測序(genome and transcriptome sequencing,G&T-Seq)利用改良二代測序技術和全基因組擴增方法同時對基因組DNA和全長mRNA進行分離和測序,能同時獲取同一細胞的DNA組和 RNA組信息,有利于我們揭示基因與其表達水平之間的關系[23]。
2 SCS技術在CRLM中的應用
腫瘤內異質性是決定腫瘤生物學、治療反應和患者生存率的關鍵因素。傳統的分子譜研究僅限于分析由非腫瘤細胞和復雜亞克隆組成的大塊組織,只能反映腫瘤樣本的平均輪廓,難以區分各細胞亞群的特征,而SCS技術的出現使得我們能夠從單個細胞水平來探討腫瘤內的細胞多樣性[24]。Tang等[25]在2009年首創了單細胞轉錄組測序技術,該技術成功消除了腫瘤內異質性所造成的影響。SCS技術的出現,使得在單細胞水平上檢測基因表達譜得以實現,能夠為CRC的防治提供新的思路。
2.1 揭示CRC細胞異質性的原因
腫瘤異質性是由于腫瘤組織內的細胞出現不同程度的分化,使得腫瘤細胞之間的遺傳和分子特征表現出明顯差異,這些差異對腫瘤的發生發展有著重要意義。在第一次基于高通量測序技術的CRC突變分析中,研究人員對9例CRC和配對組織的基因組進行了測序,發現序列和基因組結構都發生了頻繁的變化[26]。2014年Yu 等[27] 對1例結腸癌患者的腫瘤組織進行單細胞外顯子測序,檢測到2個細胞亞群,并發現大部分腫瘤細胞含有APC和TP53突變基因,小部分則以CDC27和PABPC1突變為主。Li等[24]使用來自原發大腸腫瘤和配對的癌旁正常黏膜進行單細胞轉錄組測序(single-cell transcriptome sequencing,scRNA-seq),探討CRC及其微環境的轉錄異質性,并開發了一種參考成分分析算法,鑒定了腫瘤相關成纖維細胞的兩種不同亞型,并發現僅在腫瘤組織成纖維細胞亞群中上皮-間充質轉化相關基因上調。Zhao等[28]通過SCS篩選的CRC成纖維細胞群體通過聚類分析被分為4個亞群,4個亞群在CRC中的分布和作用不同,并利用所發現的4個代表差異表達基因(TCF7L1、Flna、GPX3和MMP11)成功建立預后風險模型。Dai等[29]對CRC患者的2 824個細胞進行scRNA-seq檢測,將其分為5個不同的類群,發現不同簇與CRC的關聯度不同,其中3個簇參與細胞內的外圍功能,包括能量轉運、細胞外基質生成等,另外2個簇中的基因更多的參與免疫過程。Zhou等[30]利用單細胞多組學測序技術揭示了CRC腫瘤基質細胞中普遍存在的基因組改變,發現體細胞拷貝數改變(somatic cell copy number changes,SCNAs)普遍存在于個體的腫瘤微環境和正常組織的成纖維細胞、免疫細胞和內皮細胞中;腫瘤內SCNAs成纖維細胞的比例(11.1%~47.7%)遠高于癌旁正常組織(1.1%~10.6%)。此外,5個基因(TAGLN、MYL9、BGN、RCN3和TPM2)被鑒定為CRC預后較差的成纖維細胞特異性生物標志物。Li等[31]對腫瘤之間的差異表達蛋白質進行了共識聚類,在146個CRC原發腫瘤中,確定了3個共識簇(consensus cluster,CC),各自具有不同的分子特征和臨床預后。CC1的特征是RNA加工和DNA錯配修復(mismatched repair,MMR)增加;CC2中上調的蛋白質富含細胞外基質(extracellular matrix,ECM)受體整合、焦點黏附和免疫相關途徑;CC3對DNA復制和代謝途徑都有富集作用。這些研究表明,不僅同一細胞亞型中基因具有多樣性外,每個亞系與腫瘤的相關性也不同,CRC的腫瘤表現出明顯的異質性,這些異質性影響著疾病的轉歸和預后。
2.2 探索CRLM的分子機制
CRC患者死亡率與轉移密切相關,肝臟有豐富的血液供應,因此為CRLM提供了充分的條件。不同腫瘤對肝臟的器官趨向性受多種因素的影響,如血流模式、腫瘤分期、腫瘤組織學亞型等[32]。然而在CRC中,與遠處轉移相關的腫瘤內異質性和基因組結構的演變尚不清楚。SCS技術的發展,使腫瘤演化研究更上一層臺階,讓研究者可以更加清晰的描繪腫瘤進化過程和發現腫瘤發生發展過程中關鍵的差異表達基因,為防治腫瘤提供新的思路。Heitzer等[33]對轉移性結直腸癌的循環腫瘤細胞、原發灶和轉移瘤進行SCS分析,發現了原發灶和轉移灶中的突變驅動基因(如APC、PIK3CA和KRAS)在循環腫瘤細胞中同樣存在,表明使用循環腫瘤細胞作為液體活檢,可用于監測在腫瘤發生、發展過程中差異表達的腫瘤基因組。2015年,Kim等[34]對CRC患者的原發腫瘤和轉移灶進行深度外顯子組測序,發現CRC原發腫瘤和轉移灶內部均存在高度的遺傳異質性,而且這種異質性與腫瘤轉移有密切關系。2017年,美國安德森癌癥中心[35]利用單細胞基因組測序技術揭示了2例轉移性CRC晚期轉移模型,發現CRC中存在二次轉移現象,2個獨立的克隆譜系在不同的演化時間點由原發腫瘤轉移到轉移灶。Bian等[36]利用單細胞多組學測序技術發現在同一遺傳譜系或亞系內DNA甲基化圖譜相對穩定,且腫瘤細胞的DNA去甲基化程度與正常組織分布的重復元件核素1及異染色質相關組蛋白修飾H3K9me3的密度明顯相關,證明了單細胞多組學測序技術能夠重建細胞遺傳譜系并追蹤其轉錄動力學和表觀基因組。2019年,王智鋒[37]對CRC的原發腫瘤和轉移灶進行了單細胞全外顯子組測序,發現了驅動腫瘤轉移的關鍵基因SMAD4,同時在原發灶的T2克隆群中還發現細胞有絲分裂檢查點調控相關的基因DLG2的突變,表明晚期的腫瘤仍處于極度不穩定狀態,可以再次發生轉移。Li等[31]對146例中國CRC患者腫瘤組織的基因多組學研究發現,SMAD4在CRC轉移患者的原發腫瘤中顯示出更高的突變率。既往也有研究[38]發現,SMAD4的突變頻率隨著結腸癌的進展逐漸增高,充分表明SMAD4在CRLM中扮演著重要角色。 Zhang等[2]對臨床CRC標本進行了scRNA-seq分析,發現發生和未發生肝轉移的腫瘤組織在腫瘤微環境的信號轉導、代謝、免疫調節等多個方面的基因表達上存在差異,提出了IL-17粒細胞信號通路在CRC轉移中的作用及其機制。既往研究也發現在CRC患者的血清和腫瘤組織中IL-17的表達上調,Th17細胞可以誘導CXC趨化因子受體3、CC趨化因子受體6、轉化生長因子-β(transforming growth factor-β,TGF-β)等免疫抑制介質的產生,在CRC的發生發展中有著重要作用[39],未來針對IL-17的單克隆抗體聯合抗血管生成藥物可能是治療CRC新的研究方向。Wu等[40]使用scRNA-seq和空間轉錄組學測序對97個匹配的CRLM樣本進行了測序,展示了CRLM的單細胞和空間圖譜,并發現了肝轉移瘤組織的SPP1+巨噬細胞和MRC1+CCL18+ 巨噬細胞代謝相關的信號通路高度富集,且它們與腫瘤預后呈明顯負相關關系。Tang等[41]生成了mCRC腫瘤和正常組織的單細胞全外顯子測序數據,除檢測到常見的突變外(TP53和APC),觀察到一些突變基因(AXIN3和RASGRF1)在原發性腫瘤細胞富集的細胞群中特異性地出現,還鑒定了24個針對轉移細胞特異的非同義單核苷酸位點變異(single nucleotide variants,SNV),在CRC細胞系中敲除這些基因(包括DNAH3、TBC1D4、CMYA5、MYO18A、PLEKHA7和SLC19A3)會降低細胞遷移能力。通過SCS技術我們能夠發現CRLM中的分子機制,使我們能夠更早地進行干預和治療,延長患者生存期。
2.3 SCS在CRLM 輔助治療中的作用
CRLM是治療CRC的難點和重點,目前手術治療仍然是治愈CRLM的最佳手段,但初始可切除率僅10%~20%[42]。此外,即使切除原發腫瘤后,75%的術后患者由于術前潛在的腫瘤細胞出現了復發和轉移[43]。近年來,CRC手術結合化療、免疫治療和靶向治療越來越引起人們的關注,SCS術為探究CRLM的治療方法提供了更廣闊的視野。2013年,Kreso等[44]通過對10例CRC患者的腫瘤標本細胞進行SCS和慢病毒譜系追蹤測序,發現同一患者的各腫瘤細胞其生長動力學特征以及對奧沙利鉑的反應均表現出明顯的差異。Jabbari等[45]通過將體外器官腫瘤切片培養平臺與scRNA-seq相結合,分析了CRLM對化療的反應,發現了兩種CRLM亞型(干細胞型和腸細胞型)對化療的反應不同,其中具有干細胞樣特征的腫瘤顯示PD-1配體的優先表達,PD-1配體被5-FU和伊立替康聯合下調,導致抗腫瘤免疫反應;具有腸細胞表型的CRLM與TIM-3配體的表達相關,當與TIM-3拮抗劑聯合使用時,表現出對化療的協同反應。STIM1是SOCE的一個特異性相關基因,STIM1作為一個關鍵的鈣調節蛋白分子,在CRC、肝細胞癌等腫瘤中與腫瘤增殖、分化、遷移和凋亡密切相關。袁浩等[46]利用TIMER和Cancer SEA數據庫的scRNA-seq測序結果進行分析,發現TIM1可促進CRC免疫抵抗,STIM1與JUN和RELA共同參與的調控網絡可能是CRC免疫抵抗發生的機制,表明STIM1可能作為CRC免疫抵抗中的治療靶點和預后生物學標志物。CD73和CD39在調節腺苷轉化通路過程中起到重要作用,尤其是CD39更是參與產生免疫抑制性的腺苷過程中的限速酶。既往研究[47]發現,CD73在結直腸癌腫瘤組織中高表達,可作為評估患者預后的獨立預測因子。CD39和嘌呤能信號的改變對CRC的傳播具有調制作用,CD39mRNA的低水平似乎與生存率的增加和CRLM的延遲形成有關[48]。Kim等[49]通過對未經處理的對照組(n=3)和AB680處理組(n=3)的PD-1阻斷的小鼠大腸癌模型的CD45+ 腫瘤浸潤淋巴細胞進行了scRNA-seq,發現CD73基因NT5E和CD39基因Entpd1的表達影響T細胞受體(T cell receptor,TCR)的多樣性和T細胞的轉錄譜,表明它們在腫瘤內T淋巴細胞耗竭中起重要作用;并發現CD73抑制的瘤內免疫調節作用與PD-1阻滯劑聯合治療可能通過協同作用成為治療大腸癌的一種新的抗癌免疫治療方法。 Lin等[50]應用SCS和多重免疫組化技術對CRC和肝轉移(liver metastasis,LM)位點腫瘤微環境(tumor microenvironment,TME)的關鍵細胞群進行了鑒定,發現記憶CD8 T細胞、B細胞和CTSB+ 巨噬細胞在LM位點富集,形成記憶免疫中樞,并表明記憶免疫反應在LM部位被調用,可能由CTSB+ 巨噬細胞介導。馬燕如等[51]將GEO數據庫獲得的scRNA-seq數據分析與TCGA數據庫中的大樣本人群數據驗證相結合,成功建立了較為可靠的CRC預后預測模型,可供臨床評估患者預后參考。隨著SCS數據不斷豐富,例如CD73、STIM1等更多與腫瘤預后相關因子的加入,CRC預后預測模型更加完善,可以為臨床治療提供更多的參考價值。對SCS技術篩選出來的腫瘤靶基因的不斷深入研究,也將使得CRC患者的個體化、精準治療目標不再遙遠。
3 挑戰與展望
與傳統測序技術相比,SCS技術能進一步鑒定實體瘤內細胞的異質性,探索腫瘤發生、發展、轉移、耐藥和免疫逃逸等分子作用機制,為我們探究腫瘤的發生發展和腫瘤的防治提供更新的思路和更多的視角。 但SCS技術目前仍有很多問題有待解決,例如,在單細胞懸液制備過程中容易出現細胞死亡和污染;單細胞中遺傳物質含量低且無法實現真實重復檢測;如何在高通量測序過程中降低基因缺失、錯誤率和假陽性的比率;同時,SCS對標本要求較高、測序數據量龐大,如何降低測序成本和數據分析難度也是我們必須面對的問題。總的來說,SCS技術未來發展前景廣闊,隨著SCS技術的不斷成熟和大規模應用,我們有理由相信未來SCS數據和臨床參數的關聯性將更加緊密,更多該方面的研究成果將會轉化為臨床應用,有望實現CRC患者高質量的長期生存目標。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:陳敬禮負責查閱文獻及撰寫文稿;王國榮負責指導文稿撰寫、審閱并提出修改意見。
結直腸癌(colorectal cancer,CRC)是目前最常見的消化道惡性腫瘤之一,根據最新癌癥統計結果,CRC是位居前列腺(男性)或乳腺癌(女性)和肺癌之后的第四大常見惡性腫瘤[1]。CRC患者中,近一半會出現同時性或異時性的肝臟轉移[2],其中25%的CRC患者在其初診時即出現肝轉移[3],嚴重影響CRC患者的預后,故結直腸癌肝轉移(colorectal cancer liver metastasis,CRLM)是近年我國結直腸領域的研究熱點。在既往基于腫瘤組織測序和組學的研究中,因腫瘤細胞的高度異質性,可能錯失了大量的重要信息。近幾年隨著單細胞測序(single cell sequencing,SCS)技術的發展,消除了普通測序技術的一些弊端,使得SCS成為我們探究腫瘤細胞異質性的最好途徑[4]。SCS技術對探究腫瘤異質性和腫瘤發生、發展相關分子機制有著重要意義,能夠幫助我們找到新的腫瘤標志物、治療靶點及預測分子,使廣大患者從中受益。現就有關SCS技術在CRLM中應用的研究進展作一綜述,以提高我們對SCS和CRLM的認識。
1 測序技術的起源和進步
從Sanger等[5]發明了第一代基因測序技術和 Gilbert團隊[6]發明的“化學測序法”開始,測序技術逐漸成為探索基因層面奧秘的有效方法。Sanger測序法的基本原理是在反應體系加入雙脫氧核苷三磷酸,使得DNA聚合酶識別并聚合到3′端后,DNA鏈終止延伸,最后將反應體系分別進行電泳分析及放射自顯影,從而得到DNA的堿基序列。化學測序法通過特殊化學試劑來修飾DNA的堿基,使得DNA鏈在特定位置中斷,最終通過凝膠電泳和放射自顯影技術分析測序片段。但這兩種方法由于其程序復雜、通量低、成本高、數據產出較低等問題難以在臨床上大規模應用。此后第二代測序技術通過通用引物來定位DNA分子核酸序列信息,該技術相比一代測序技術大幅度降低了測序成本,因其高通量的特點使得基因測序從單個位點進階到全基因組層面,主要包括illumina測序和454-Roche測序。二代測序技術將基因擴增、堿基測序與數據收集3個步驟同步進行,能夠同時獲得數千至數十億條DNA模板的測序結果[7]。二代測序技術雖然通量有所提高,但其測序序列讀長較短,無法實現全基因組覆蓋且難以檢測和表征結構變異。在此背景下,出現了以單分子測序技術發展為基礎的第三代測序技術,該技術不需要擴增DNA就可以直接測序,不僅通量更高,而且克服了讀長限制,能夠實現全基因組覆蓋,可以直接檢測本地DNA的表觀遺傳修飾[8]。但三代測序對樣本核酸質量要求很高,且其測序錯誤率和成本仍相對較高,無法完全取代二代測序。
然而,上述測序技術多局限于器官與組織群體細胞的檢測,其表達水平可能受到異質性的影響。近年來出現的SCS技術,將單細胞分離技術、核酸擴增技術及高通量測序技術相融合,有效地彌補了上述不足,可用于發現多個細胞之間的進化關系,進而揭示腫瘤細胞存在的異質性,成為了目前細胞生物學分析的重要工具[9]。通過對SCS結果的分析,不僅能揭示腫瘤內細胞異質性,還能有效區分腫瘤組織中的多種細胞亞型,進而有利于對腫瘤發生、發展、轉移、耐藥和免疫逃逸相關機制的研究[10]。
1.1 SCS的技術原理
SCS技術是在單細胞水平通過均勻擴增單一細胞的遺傳物質,標記建庫后進行測序,最后對單個細胞全基因組的測序結果展開數據分析。其流程主要有以下4個步驟:① 單細胞分離;② 細胞溶解與獲取遺傳物質;③ 全基因組擴增;④ 測序與數據分析。
分離單個細胞是進行各種SCS的首要步驟,主要方法有連續稀釋法、流式細胞術、電泳細胞分離技術、微流控技術、激光捕獲顯微切割術等。組織經單細胞分離溶解之后,需提取單個細胞的微量基因進行基因擴增,構建基因文庫以達到后續測序的目的。目前主要的基因擴增方法包括多重退火環狀循環擴增、多重置換擴增、退行性寡核苷酸聚合酶鏈反應等。其中,多重置換擴增因其對全基因組的覆蓋率最高常用于檢測單核苷酸的突變,而退行性寡核苷酸聚合酶鏈反應和多重退火環狀循環擴增對基因組擴增的均一性更好,常用于檢測基因拷貝數變異[11]。SCS主要包括先擴增再測序的第二代高通量測序和不需擴增直接測序的第三代高通量測序,其中第二代測序具有成本較低和測序效率較高的特點,而第三代測序是一種不依賴PCR擴增技術的單分子測序技術,能夠避免PCR擴增產生的誤差且效率更高[12]。進行數據分析時需要對測序原始數據生成特定格式(Fastq格式)進行質量控制,基于特異分子標簽(unique molecular identifiers,UMI)總數和檢測到的基因數等過濾掉不合格的數據,然后根據細胞特異性標簽,將拆解后的測序數據構建成單細胞基因表達矩陣用于下游分析[13]。 基因水平分析與細胞水平分析是SCS數據下游分析的兩個方向,基因水平分析主要用于基因的富集分析、調控網絡以及尋找差異表達基因等方向,而細胞水平分析主要體現在聚類分析和軌跡推斷。
1.2 SCS的技術分類
SCS主要包括單細胞基因組測序(single cell DNA sequencing,scDNA-seq)、單細胞轉錄組測序(single cell RNA sequencing,scRNA-seq)和單細胞表觀組測序(single cell epigenome sequencing),這3種測序類型能夠從不同層面來揭示細胞各個階段的特性和功能[14]。近年來,SCS技術不斷發展,陸續出現了一批以單組學技術發展為基礎的單細胞多組學技術(single-cell multi-omics sequencing,scCOOL-Seq) [15],這些多組學測序技術能夠捕獲同一細胞的轉錄組、基因組和表觀基因組在內的多種信息,從而使我們能夠在單細胞分辨率上展開全面聯合分析。
1.2.1 單細胞基因組測序技術
單細胞基因組測序技術是在單細胞分離、溶解后,通過擴增所獲取的微量全基因組DNA以獲得高覆蓋率的完整基因組,進而進行高通量測序和數據分析。單細胞基因組測序可以揭示以前在不同研究領域無法解決的生物學問題,包括體細胞突變、生物發育、基因組功能、微生物學等[16]。尤其在腫瘤方面,可以獲得癌細胞的特定突變來源及突變頻率,以及區分腫瘤的發展、演化、轉移過程中的突變,進而探究細胞的進化關系和群體差異[17]。
1.2.2 單細胞轉錄組測序技術
單細胞轉錄組測序技術是在單細胞分離、溶解后,提取單細胞中的RNA,將捕獲的mRNA反轉錄為cDNA,然后通過PCR技術或其他轉錄方法擴增整個轉錄組,最后再進行測序和文庫構建[18],這種測序技術不僅可以確切地檢測出細胞中的動態基因表達及調控信息,還能準確區分不同發育階段細胞的類型和狀態[19],在揭示組織組成、基因間調控關系和轉錄動力學方面具有重要作用。
1.2.3 單細胞表觀組測序技術
表觀遺傳是指DNA序列改變之外的基因表達及調控的可遺傳改變,主要包括DNA/RNA甲基化、染色質的重塑和三維空間構象、組蛋白修飾等,它們在生物體的基因表達調控中同樣起著重要作用[20]。 單細胞表觀組測序可以補充基因組和轉錄組測序,提供洞察細胞類型特定的基因表達調控,對研究表觀遺傳學的時空特異性具有重要價值[14]。 近幾十年來,結合位點分析法—染色質免疫沉淀后測序(chromatin immunoprecipitation followed by sequencing,ChIP-SEQ)方法幾乎是表觀基因組分析的唯一方法,然而,這種方法是一種基于免疫沉淀的技術,在回收與目標蛋白結合的基因組DNA方面通常效率不高[21]。隨后不依賴于免疫沉淀的測序技術被開發出來,可以在單細胞水平上進行表觀基因組分析,其中包括染色質整合標記測序(chromatin integration labeling sequencing,Chil-Seq)、靶下切割和標記(cleavage under targets and tagmentation,Cut&Tag)技術和單細胞免疫切割測序(single-cell immunocleavage sequencing,Chic-Seq)。
1.2.4 單細胞多組學技術
相較于利用不同的單細胞單組學測序方法從單個細胞中分別獲取轉錄組、基因組、表觀遺傳組等進行分析,單細胞多組學測序技術(single-cell multi-omics sequencing,scCOOL-Seq)可以從同一個單細胞中同時獲取多種組學數據,因而可以更好地反映細胞在特定狀態下各組學間的關聯以及復雜的分子調控網絡[22]。例如,基因組與轉錄組組合測序(genome and transcriptome sequencing,G&T-Seq)利用改良二代測序技術和全基因組擴增方法同時對基因組DNA和全長mRNA進行分離和測序,能同時獲取同一細胞的DNA組和 RNA組信息,有利于我們揭示基因與其表達水平之間的關系[23]。
2 SCS技術在CRLM中的應用
腫瘤內異質性是決定腫瘤生物學、治療反應和患者生存率的關鍵因素。傳統的分子譜研究僅限于分析由非腫瘤細胞和復雜亞克隆組成的大塊組織,只能反映腫瘤樣本的平均輪廓,難以區分各細胞亞群的特征,而SCS技術的出現使得我們能夠從單個細胞水平來探討腫瘤內的細胞多樣性[24]。Tang等[25]在2009年首創了單細胞轉錄組測序技術,該技術成功消除了腫瘤內異質性所造成的影響。SCS技術的出現,使得在單細胞水平上檢測基因表達譜得以實現,能夠為CRC的防治提供新的思路。
2.1 揭示CRC細胞異質性的原因
腫瘤異質性是由于腫瘤組織內的細胞出現不同程度的分化,使得腫瘤細胞之間的遺傳和分子特征表現出明顯差異,這些差異對腫瘤的發生發展有著重要意義。在第一次基于高通量測序技術的CRC突變分析中,研究人員對9例CRC和配對組織的基因組進行了測序,發現序列和基因組結構都發生了頻繁的變化[26]。2014年Yu 等[27] 對1例結腸癌患者的腫瘤組織進行單細胞外顯子測序,檢測到2個細胞亞群,并發現大部分腫瘤細胞含有APC和TP53突變基因,小部分則以CDC27和PABPC1突變為主。Li等[24]使用來自原發大腸腫瘤和配對的癌旁正常黏膜進行單細胞轉錄組測序(single-cell transcriptome sequencing,scRNA-seq),探討CRC及其微環境的轉錄異質性,并開發了一種參考成分分析算法,鑒定了腫瘤相關成纖維細胞的兩種不同亞型,并發現僅在腫瘤組織成纖維細胞亞群中上皮-間充質轉化相關基因上調。Zhao等[28]通過SCS篩選的CRC成纖維細胞群體通過聚類分析被分為4個亞群,4個亞群在CRC中的分布和作用不同,并利用所發現的4個代表差異表達基因(TCF7L1、Flna、GPX3和MMP11)成功建立預后風險模型。Dai等[29]對CRC患者的2 824個細胞進行scRNA-seq檢測,將其分為5個不同的類群,發現不同簇與CRC的關聯度不同,其中3個簇參與細胞內的外圍功能,包括能量轉運、細胞外基質生成等,另外2個簇中的基因更多的參與免疫過程。Zhou等[30]利用單細胞多組學測序技術揭示了CRC腫瘤基質細胞中普遍存在的基因組改變,發現體細胞拷貝數改變(somatic cell copy number changes,SCNAs)普遍存在于個體的腫瘤微環境和正常組織的成纖維細胞、免疫細胞和內皮細胞中;腫瘤內SCNAs成纖維細胞的比例(11.1%~47.7%)遠高于癌旁正常組織(1.1%~10.6%)。此外,5個基因(TAGLN、MYL9、BGN、RCN3和TPM2)被鑒定為CRC預后較差的成纖維細胞特異性生物標志物。Li等[31]對腫瘤之間的差異表達蛋白質進行了共識聚類,在146個CRC原發腫瘤中,確定了3個共識簇(consensus cluster,CC),各自具有不同的分子特征和臨床預后。CC1的特征是RNA加工和DNA錯配修復(mismatched repair,MMR)增加;CC2中上調的蛋白質富含細胞外基質(extracellular matrix,ECM)受體整合、焦點黏附和免疫相關途徑;CC3對DNA復制和代謝途徑都有富集作用。這些研究表明,不僅同一細胞亞型中基因具有多樣性外,每個亞系與腫瘤的相關性也不同,CRC的腫瘤表現出明顯的異質性,這些異質性影響著疾病的轉歸和預后。
2.2 探索CRLM的分子機制
CRC患者死亡率與轉移密切相關,肝臟有豐富的血液供應,因此為CRLM提供了充分的條件。不同腫瘤對肝臟的器官趨向性受多種因素的影響,如血流模式、腫瘤分期、腫瘤組織學亞型等[32]。然而在CRC中,與遠處轉移相關的腫瘤內異質性和基因組結構的演變尚不清楚。SCS技術的發展,使腫瘤演化研究更上一層臺階,讓研究者可以更加清晰的描繪腫瘤進化過程和發現腫瘤發生發展過程中關鍵的差異表達基因,為防治腫瘤提供新的思路。Heitzer等[33]對轉移性結直腸癌的循環腫瘤細胞、原發灶和轉移瘤進行SCS分析,發現了原發灶和轉移灶中的突變驅動基因(如APC、PIK3CA和KRAS)在循環腫瘤細胞中同樣存在,表明使用循環腫瘤細胞作為液體活檢,可用于監測在腫瘤發生、發展過程中差異表達的腫瘤基因組。2015年,Kim等[34]對CRC患者的原發腫瘤和轉移灶進行深度外顯子組測序,發現CRC原發腫瘤和轉移灶內部均存在高度的遺傳異質性,而且這種異質性與腫瘤轉移有密切關系。2017年,美國安德森癌癥中心[35]利用單細胞基因組測序技術揭示了2例轉移性CRC晚期轉移模型,發現CRC中存在二次轉移現象,2個獨立的克隆譜系在不同的演化時間點由原發腫瘤轉移到轉移灶。Bian等[36]利用單細胞多組學測序技術發現在同一遺傳譜系或亞系內DNA甲基化圖譜相對穩定,且腫瘤細胞的DNA去甲基化程度與正常組織分布的重復元件核素1及異染色質相關組蛋白修飾H3K9me3的密度明顯相關,證明了單細胞多組學測序技術能夠重建細胞遺傳譜系并追蹤其轉錄動力學和表觀基因組。2019年,王智鋒[37]對CRC的原發腫瘤和轉移灶進行了單細胞全外顯子組測序,發現了驅動腫瘤轉移的關鍵基因SMAD4,同時在原發灶的T2克隆群中還發現細胞有絲分裂檢查點調控相關的基因DLG2的突變,表明晚期的腫瘤仍處于極度不穩定狀態,可以再次發生轉移。Li等[31]對146例中國CRC患者腫瘤組織的基因多組學研究發現,SMAD4在CRC轉移患者的原發腫瘤中顯示出更高的突變率。既往也有研究[38]發現,SMAD4的突變頻率隨著結腸癌的進展逐漸增高,充分表明SMAD4在CRLM中扮演著重要角色。 Zhang等[2]對臨床CRC標本進行了scRNA-seq分析,發現發生和未發生肝轉移的腫瘤組織在腫瘤微環境的信號轉導、代謝、免疫調節等多個方面的基因表達上存在差異,提出了IL-17粒細胞信號通路在CRC轉移中的作用及其機制。既往研究也發現在CRC患者的血清和腫瘤組織中IL-17的表達上調,Th17細胞可以誘導CXC趨化因子受體3、CC趨化因子受體6、轉化生長因子-β(transforming growth factor-β,TGF-β)等免疫抑制介質的產生,在CRC的發生發展中有著重要作用[39],未來針對IL-17的單克隆抗體聯合抗血管生成藥物可能是治療CRC新的研究方向。Wu等[40]使用scRNA-seq和空間轉錄組學測序對97個匹配的CRLM樣本進行了測序,展示了CRLM的單細胞和空間圖譜,并發現了肝轉移瘤組織的SPP1+巨噬細胞和MRC1+CCL18+ 巨噬細胞代謝相關的信號通路高度富集,且它們與腫瘤預后呈明顯負相關關系。Tang等[41]生成了mCRC腫瘤和正常組織的單細胞全外顯子測序數據,除檢測到常見的突變外(TP53和APC),觀察到一些突變基因(AXIN3和RASGRF1)在原發性腫瘤細胞富集的細胞群中特異性地出現,還鑒定了24個針對轉移細胞特異的非同義單核苷酸位點變異(single nucleotide variants,SNV),在CRC細胞系中敲除這些基因(包括DNAH3、TBC1D4、CMYA5、MYO18A、PLEKHA7和SLC19A3)會降低細胞遷移能力。通過SCS技術我們能夠發現CRLM中的分子機制,使我們能夠更早地進行干預和治療,延長患者生存期。
2.3 SCS在CRLM 輔助治療中的作用
CRLM是治療CRC的難點和重點,目前手術治療仍然是治愈CRLM的最佳手段,但初始可切除率僅10%~20%[42]。此外,即使切除原發腫瘤后,75%的術后患者由于術前潛在的腫瘤細胞出現了復發和轉移[43]。近年來,CRC手術結合化療、免疫治療和靶向治療越來越引起人們的關注,SCS術為探究CRLM的治療方法提供了更廣闊的視野。2013年,Kreso等[44]通過對10例CRC患者的腫瘤標本細胞進行SCS和慢病毒譜系追蹤測序,發現同一患者的各腫瘤細胞其生長動力學特征以及對奧沙利鉑的反應均表現出明顯的差異。Jabbari等[45]通過將體外器官腫瘤切片培養平臺與scRNA-seq相結合,分析了CRLM對化療的反應,發現了兩種CRLM亞型(干細胞型和腸細胞型)對化療的反應不同,其中具有干細胞樣特征的腫瘤顯示PD-1配體的優先表達,PD-1配體被5-FU和伊立替康聯合下調,導致抗腫瘤免疫反應;具有腸細胞表型的CRLM與TIM-3配體的表達相關,當與TIM-3拮抗劑聯合使用時,表現出對化療的協同反應。STIM1是SOCE的一個特異性相關基因,STIM1作為一個關鍵的鈣調節蛋白分子,在CRC、肝細胞癌等腫瘤中與腫瘤增殖、分化、遷移和凋亡密切相關。袁浩等[46]利用TIMER和Cancer SEA數據庫的scRNA-seq測序結果進行分析,發現TIM1可促進CRC免疫抵抗,STIM1與JUN和RELA共同參與的調控網絡可能是CRC免疫抵抗發生的機制,表明STIM1可能作為CRC免疫抵抗中的治療靶點和預后生物學標志物。CD73和CD39在調節腺苷轉化通路過程中起到重要作用,尤其是CD39更是參與產生免疫抑制性的腺苷過程中的限速酶。既往研究[47]發現,CD73在結直腸癌腫瘤組織中高表達,可作為評估患者預后的獨立預測因子。CD39和嘌呤能信號的改變對CRC的傳播具有調制作用,CD39mRNA的低水平似乎與生存率的增加和CRLM的延遲形成有關[48]。Kim等[49]通過對未經處理的對照組(n=3)和AB680處理組(n=3)的PD-1阻斷的小鼠大腸癌模型的CD45+ 腫瘤浸潤淋巴細胞進行了scRNA-seq,發現CD73基因NT5E和CD39基因Entpd1的表達影響T細胞受體(T cell receptor,TCR)的多樣性和T細胞的轉錄譜,表明它們在腫瘤內T淋巴細胞耗竭中起重要作用;并發現CD73抑制的瘤內免疫調節作用與PD-1阻滯劑聯合治療可能通過協同作用成為治療大腸癌的一種新的抗癌免疫治療方法。 Lin等[50]應用SCS和多重免疫組化技術對CRC和肝轉移(liver metastasis,LM)位點腫瘤微環境(tumor microenvironment,TME)的關鍵細胞群進行了鑒定,發現記憶CD8 T細胞、B細胞和CTSB+ 巨噬細胞在LM位點富集,形成記憶免疫中樞,并表明記憶免疫反應在LM部位被調用,可能由CTSB+ 巨噬細胞介導。馬燕如等[51]將GEO數據庫獲得的scRNA-seq數據分析與TCGA數據庫中的大樣本人群數據驗證相結合,成功建立了較為可靠的CRC預后預測模型,可供臨床評估患者預后參考。隨著SCS數據不斷豐富,例如CD73、STIM1等更多與腫瘤預后相關因子的加入,CRC預后預測模型更加完善,可以為臨床治療提供更多的參考價值。對SCS技術篩選出來的腫瘤靶基因的不斷深入研究,也將使得CRC患者的個體化、精準治療目標不再遙遠。
3 挑戰與展望
與傳統測序技術相比,SCS技術能進一步鑒定實體瘤內細胞的異質性,探索腫瘤發生、發展、轉移、耐藥和免疫逃逸等分子作用機制,為我們探究腫瘤的發生發展和腫瘤的防治提供更新的思路和更多的視角。 但SCS技術目前仍有很多問題有待解決,例如,在單細胞懸液制備過程中容易出現細胞死亡和污染;單細胞中遺傳物質含量低且無法實現真實重復檢測;如何在高通量測序過程中降低基因缺失、錯誤率和假陽性的比率;同時,SCS對標本要求較高、測序數據量龐大,如何降低測序成本和數據分析難度也是我們必須面對的問題。總的來說,SCS技術未來發展前景廣闊,隨著SCS技術的不斷成熟和大規模應用,我們有理由相信未來SCS數據和臨床參數的關聯性將更加緊密,更多該方面的研究成果將會轉化為臨床應用,有望實現CRC患者高質量的長期生存目標。
重要聲明
利益沖突聲明:本文全體作者閱讀并理解了《中國普外基礎與臨床雜志》的政策聲明,我們沒有相互競爭的利益。
作者貢獻聲明:陳敬禮負責查閱文獻及撰寫文稿;王國榮負責指導文稿撰寫、審閱并提出修改意見。