單細(xì)胞全基因組測序技術(shù)(scWGS)可以有效揭示生物樣品中不同細(xì)胞之間的異質(zhì)性,并系統(tǒng)鑒定單個細(xì)胞的基因組中發(fā)生的遺傳變化,例如拷貝數(shù)變異(CNV)和點突變(單核苷酸變異,SNV)等。過去十年,研究人員已經(jīng)開發(fā)出多種單細(xì)胞基因組擴增技術(shù),例如簡并寡核苷酸引物PCR擴增技術(shù)(DOP-PCR)、多重置換擴增技術(shù)(MDA)、多重退火和基于環(huán)的擴增循環(huán)技術(shù)(MALBAC),以及通過轉(zhuǎn)座子插入和體外轉(zhuǎn)錄進(jìn)行線性擴增技術(shù)(LIANTI)等。但是,目前的單細(xì)胞全基因組測序技術(shù)均基于二代測序(NGS)平臺,該平臺檢測準(zhǔn)確度高,但是測序讀長相對較短(通常只有150bpX2),主要適用于檢測單個細(xì)胞中的單核苷酸變異(SNV)、小的插入缺失(<50bp,Indel)以及拷貝數(shù)變異(CNV)等。由于二代測序平臺讀長的限制,對于基因組中結(jié)構(gòu)變異的檢測具有很大的局限性。結(jié)構(gòu)變異(包括插入、缺失、重復(fù)和易位等)是人類體細(xì)胞遺傳變異的主要來源之一,對腫瘤的發(fā)生、發(fā)展和轉(zhuǎn)移具有潛在的驅(qū)動作用,然而目前在單個細(xì)胞水平對基因組結(jié)構(gòu)變異的研究卻鮮有報道。

北京大學(xué)湯富酬課題組開發(fā)出單細(xì)胞基因組單分子測序新方法-肽度TIMEDOO

論文截圖

針對基于二代測序平臺的單細(xì)胞基因組測序技術(shù)難以高效鑒定單個細(xì)胞中結(jié)構(gòu)變異這一世界難題,2021年6月30日,北京未來基因診斷高精尖創(chuàng)新中心、北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心湯富酬課題組在Genome Biology上在線發(fā)表了題為“SMOOTH-seq: single-cell genome sequencing of human cells on athird-generation sequencing platform”的研究論文,在國際上率先開發(fā)了基于三代測序(單分子測序)平臺的單細(xì)胞基因組測序技術(shù)。

該研究的主要突破有:

開發(fā)了一種高精度的基于三代測序(單分子測序)平臺的單細(xì)胞基因組測序方法——SMOOTH-seq(Single-MOlecule real-time sequencing of LOng Fragments amplified THrough Transposon insertion)。使用優(yōu)化后的Tn5轉(zhuǎn)座反應(yīng),SMOOTH-seq能夠從單個細(xì)胞中擴增出平均長度約6kb的基因組片段(測序讀長比單細(xì)胞基因組二代測序技術(shù)長了20倍左右),通過引入與單分子測序平臺兼容的細(xì)胞條形碼使單細(xì)胞基因組DNA擴增子適用于Pacbio sequel II平臺的HiFi測序模式。測序后的數(shù)據(jù)中,產(chǎn)生的環(huán)化測序(circular consensus sequencing, CCS)的讀長平均在6kb左右, 最長可達(dá)43kb。(如圖1所示)。

北京大學(xué)湯富酬課題組開發(fā)出單細(xì)胞基因組單分子測序新方法-肽度TIMEDOO

圖1. SMOOTH-seq的流程和評估

該研究開發(fā)的SMOOTH-seq方法能夠在單個細(xì)胞中高效檢測基因組結(jié)構(gòu)變異。在單個K562細(xì)胞中,當(dāng)測序深度僅為0.4X時,基因組覆蓋度可達(dá)19%。該研究對91個單細(xì)胞進(jìn)行SMOOTH-seq分析,從中檢測到4,790 個缺失事件和5,589個插入事件,其中87%的缺失片段和91% 的插入片段長度小于1kb,檢測到的插入事件DNA片段最長達(dá)到7.7kb。同時,該研究也在K562細(xì)胞中檢測到521個易位事件,包括準(zhǔn)確檢測到兩對經(jīng)典融合基因:BCR-ABL 和NUP214-XKR3。SMOOTH-seq技術(shù)對結(jié)構(gòu)變異的檢測精度高,當(dāng)使用K562大量細(xì)胞的基因組三代測序結(jié)果作為比較基準(zhǔn)時,該研究中使用的K562細(xì)胞系的每個單細(xì)胞中的結(jié)構(gòu)變異檢測平均精確度為75%,特別是在單個細(xì)胞中檢測插入事件平均精確度為85%。此外,SMOOTH-seq 也可以以1Mb 的分辨率準(zhǔn)確檢測到兩個K562克隆之間的不同拷貝數(shù)變異(CNV)事件。(如圖2所示)

北京大學(xué)湯富酬課題組開發(fā)出單細(xì)胞基因組單分子測序新方法-肽度TIMEDOO

圖2. 單個K562細(xì)胞中CNV及結(jié)構(gòu)變異檢測的精確度

該研究開發(fā)的SMOOTH-seq方法能夠在單個細(xì)胞中高效檢測染色體外環(huán)形DNA(ecDNA)。已有的研究報道表明,染色體外環(huán)形DNA在腫瘤發(fā)生中比較常見,且致癌基因能夠在染色體外環(huán)形DNA中進(jìn)行大量擴增,促進(jìn)腫瘤發(fā)生和轉(zhuǎn)移。SMOOTH-seq技術(shù)產(chǎn)生的長讀長數(shù)據(jù),使其能夠被用于在單個細(xì)胞中精準(zhǔn)捕獲小于10kb的全長染色體外環(huán)形DNA。本研究同時開發(fā)了用于鑒定K562細(xì)胞系中的染色體外環(huán)形DNA的生物信息學(xué)分析方法。當(dāng)僅有一個拷貝的Tn5轉(zhuǎn)座酶與一個染色體外環(huán)形DNA分子結(jié)合時,整個環(huán)形DNA分子就可被完整擴增為一個線性片段,即單個讀段即可覆蓋一個染色體外環(huán)形DNA分子的全長序列。通過統(tǒng)計Tn5插入位置不同但長度完全相同的一組讀段,即可判斷它們是否來源于同一個環(huán)形DNA。同時該特征可用于幫助精準(zhǔn)區(qū)分染色體外環(huán)形DNA和串聯(lián)重復(fù)序列(如圖3所示)。

北京大學(xué)湯富酬課題組開發(fā)出單細(xì)胞基因組單分子測序新方法-肽度TIMEDOO

圖3. SMOOTH-seq精準(zhǔn)檢測染色體外環(huán)形DNA的示意圖

該研究開發(fā)的SMOOTH-seq方法能以較高準(zhǔn)確度檢測基因點突變(SNV)。由于三代測序平臺本身的局限性,使用SMOOTH-seq方法在單個細(xì)胞中檢測SNV的假陽性率為2.0 × 10-5。(如圖4所示)

北京大學(xué)湯富酬課題組開發(fā)出單細(xì)胞基因組單分子測序新方法-肽度TIMEDOO

圖4. SMOOTH-seq 檢測單細(xì)胞K562中SNV的假陽性率

該研究開發(fā)的SMOOTH-seq方法可以在結(jié)直腸癌腫瘤樣本中準(zhǔn)確檢測出各種基因組結(jié)構(gòu)變異事件。在對患者結(jié)直腸癌腫瘤樣本的分析中,以在結(jié)直腸癌的至少2個單細(xì)胞中同時檢測到為標(biāo)準(zhǔn),該研究檢測出8,594個結(jié)構(gòu)變異事件(4,089個插入事件,3,852個缺失事件,341個易位事件,以及312個重復(fù)事件)。通過將結(jié)直腸癌腫瘤樣本和K562細(xì)胞系中共有的結(jié)構(gòu)變異去除后,該研究共得到3,570個結(jié)直腸癌腫瘤細(xì)胞特異性的結(jié)構(gòu)變異事件(1,376 插入事件, 1,661 缺失事件, 230 易位事件以及303 重復(fù)事件)。同時,該研究通過設(shè)置多個對照基因組(包括相應(yīng)的腫瘤組織、與腫瘤相鄰的正常組織、GM12878細(xì)胞系和另一個體的外周血單核細(xì)胞的基因組)對檢測出的結(jié)構(gòu)變異事件進(jìn)行了PCR驗證。此外,該研究發(fā)現(xiàn)結(jié)直腸癌腫瘤樣本和K562細(xì)胞系中共有的結(jié)構(gòu)變異在所有被檢測的多個人類基因組DNA樣品中均存在,說明這些結(jié)構(gòu)變異事件實際上是由于當(dāng)前的人類參考基因組不夠完善,缺失了部分關(guān)鍵序列信息引起的。今后三代測序?qū)⒂兄诮M裝出更完整精準(zhǔn)的人類參考基因組序列。(如圖5所示)

北京大學(xué)湯富酬課題組開發(fā)出單細(xì)胞基因組單分子測序新方法-肽度TIMEDOO

圖5. PCR驗證基因組結(jié)構(gòu)變異的結(jié)果

綜上,該研究開發(fā)的單細(xì)胞基因組單分子測序技術(shù)(SMOOTH-seq),將長讀長的三代測序技術(shù)巧妙運用到了單細(xì)胞基因組測序上,能夠?qū)崿F(xiàn)對于基因組結(jié)構(gòu)變異、染色體外環(huán)形DNA等多種分子事件的高精度檢測,大大提高了單細(xì)胞基因組測序技術(shù)的適用范圍,具有廣闊的應(yīng)用前景。該研究開創(chuàng)了單細(xì)胞基因組單分子測序時代,該研究開發(fā)的單細(xì)胞基因組單分子測序技術(shù)將揭開更多的人類基因組中的“暗物質(zhì)”的奧秘,給人類生物醫(yī)學(xué)研究帶來全新的發(fā)展機遇。

生物島實驗室研究員范小英、北京大學(xué)楊成博士以及北京大學(xué)前沿交叉學(xué)科研究院博士生李文為該論文的并列第一作者。北京未來基因診斷高精尖創(chuàng)新中心、北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心湯富酬教授為該論文的通訊作者。該研究項目得到了國家自然科學(xué)基金委、北京市科技委和北京未來基因診斷高精尖創(chuàng)新中心的支持。

來源:北京大學(xué)