最近幾年的研究表明,染色體外環(huán)狀DNA(ecDNA)可以促進(jìn)癌基因擴(kuò)增,驅(qū)動(dòng)腫瘤進(jìn)化,并具有遺傳異質(zhì)性,在癌癥發(fā)生中發(fā)揮著關(guān)鍵作用[1,2,3,4]。但由于缺乏足夠的分子分析技術(shù),盡管ecDNA自1964年以來就已為人所知,對(duì)其具體作用的闡明卻一直進(jìn)展緩慢。目前的研究主要通過拷貝數(shù)變異(如Amplicon Architect)[5]和識(shí)別ecDNA junction位點(diǎn)(如Circle-Map和CIRC_finder)[6,7]等方法從測(cè)序數(shù)據(jù)中識(shí)別ecDNA。但是對(duì)ecDNA功能表觀遺傳學(xué)的研究還很缺乏。而了解全基因組范圍ecDNA的染色質(zhì)狀態(tài)和轉(zhuǎn)錄狀態(tài)是至關(guān)重要的,有助于促進(jìn)對(duì)ecDNA及其在癌基因表達(dá)中的作用的深層認(rèn)識(shí)。用傳統(tǒng)的ATAC-Seq和Chip-Seq等方法進(jìn)行ecDNA研究時(shí)需要將DNA打斷,進(jìn)行短片段測(cè)序,配合的計(jì)算方法大部分是通過檢測(cè)junction位點(diǎn)來識(shí)別ecDNA,所以只能揭示鄰近junction區(qū)域的染色質(zhì)可及性和DNA結(jié)合蛋白修飾,而不能提供完整的ecDNA染色質(zhì)狀態(tài)以及中遠(yuǎn)端調(diào)控元件之間的關(guān)系。另外,傳統(tǒng)方法的數(shù)據(jù)分析基于peak calling策略,無法提供單分子級(jí)的ecDNA結(jié)構(gòu)和表觀遺傳信息,所以也無法獲得不同狀態(tài)下ecDNA分子的表觀異質(zhì)性。近兩年,基于單分子長讀長測(cè)序方法開發(fā)的nanoNOMe-seq[8]、SMAC-seq[9]和Fiber-seq[10]技術(shù),可以同時(shí)獲得單個(gè)DNA分子的堿基信息和甲基化信息,已經(jīng)在單分子表觀遺傳異質(zhì)性與調(diào)控元件遠(yuǎn)端互作方面取得了應(yīng)用,但在ecDNA領(lǐng)域還未見報(bào)道。
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
基于上述,華大基因唐沖博士團(tuán)隊(duì)于近日在表觀遺傳與染色質(zhì)研究權(quán)威期刊Epigenetics & Chromatin上發(fā)表題為”Sequencing of methylase-accessible regions in integral circular extrachromosomal DNA reveals differences in chromatin structure”的論文(點(diǎn)擊頁面左下方“閱讀原文”可查看),開發(fā)出一種單分子層級(jí)研究ecDNA染色質(zhì)開放性的新技術(shù) —— CCDA-seq
01研究成果
該研究利用m6A MTase甲基轉(zhuǎn)移酶對(duì)基因組DNA進(jìn)行處理,獲得單分子水平的染色質(zhì)開放性區(qū)域的m6A DNA甲基化修飾((圖1A)。為了提高ecDNA捕獲效率,該方法還引入外切酶去除線性基因組DNA并通過納米孔測(cè)序?qū)ν暾膃cDNA進(jìn)行測(cè)序。對(duì)生成的數(shù)據(jù),首先通過junction序列識(shí)別ecDNA分子,并動(dòng)態(tài)地將序列片段映射到基因組中(圖1B)?;趈unction的位置,重新組裝部分ecDNA序列作為新的參考,并根據(jù)重組后的ecDNA序列識(shí)別出m6A信號(hào),以防止juction區(qū)域的信號(hào)產(chǎn)生偏差,并且重構(gòu)了完整的ecDNA(圖1B)。
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖1 流程概況A. 左為ATAC-seq+ecDNA,右為CCDA-seq+ecDNA;B. 生信分析流程
為了提高m6A甲基化判讀的準(zhǔn)確性,該方法增加了陰性樣本進(jìn)行m6A甲基化的識(shí)別,通過高斯混合模型對(duì)calling的概率值分布進(jìn)行擬合,去除了背景噪聲(圖2)。并且通過與DNase-seq進(jìn)行比較,CCDA-seq與DNase-seq數(shù)據(jù)在高表達(dá)基因的轉(zhuǎn)錄起始位點(diǎn)周圍顯示了相似的核小體模式,在不同分辨率的基因組尺度上也具有高度的一致性(圖3、圖4)。測(cè)序reads長度在10到100 kb之間,比傳統(tǒng)ATAC-seq中觀察到的Junction區(qū)域?qū)?0倍(圖5)。
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖2 經(jīng)處理和未處理樣品的m6A甲基化概率分布A. 陰性樣本;B. 甲基轉(zhuǎn)移酶標(biāo)記樣本
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖3 高表達(dá)基因在轉(zhuǎn)錄起始位點(diǎn)周圍的染色質(zhì)可及性
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖4 CCDA-seq信號(hào)與DNase-seq染色質(zhì)可達(dá)性信號(hào)在基因組上的分布
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖5 ONT reads長度分布
進(jìn)一步,通過比較ecDNA和同源線性DNA的平均染色質(zhì)可及性,發(fā)現(xiàn)ecDNA染色質(zhì)的可及性大部分是高度開放的,并且比線性DNA的染色質(zhì)可及性更高,強(qiáng)化了ecDNA擴(kuò)增會(huì)導(dǎo)致更高的致癌基因轉(zhuǎn)錄的普遍觀點(diǎn)。(圖6)RNA-seq數(shù)據(jù)分析顯示,ecDNA高表達(dá)基因340個(gè)(25% rank),中表達(dá)基因464個(gè)(25-75% rank),低表達(dá)基因589個(gè)(75%-100% rank),說明并不是所有的ecDNA基因都是高表達(dá)的(圖7)。通過分析轉(zhuǎn)錄起始/終止位點(diǎn)的附近的染色質(zhì)可及性信號(hào),CCDA-seq準(zhǔn)確定位到NDR(nucleosome depletion regions)(圖8)。
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖6 ecDNA和線性DNA中的甲基化率密度分布
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖7 ecDNA和線性DNA上基因區(qū)域的平均甲基化率
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖8 轉(zhuǎn)錄起始位點(diǎn)與轉(zhuǎn)錄終止位點(diǎn)上下游ecDNA與線性DNA的信號(hào)值分布
為了進(jìn)一步探索ecDNA的功能,該方法對(duì)ecDNA單分子數(shù)據(jù)進(jìn)行組裝,重構(gòu)出完整ecDNA,并且ecDNA上攜帶完整的致癌基因。如TSG101?(Tumor Susceptibility Gene 101.), 對(duì)ecDNA上的基因進(jìn)行Gene Ontology分析顯示富集到與癌癥顯著相關(guān)的通路,如GTPase activator activity。
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖9 完整的ecDNA
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖10 ecDNA相關(guān)基因的gene ontology分析
CCDA-seq 提供了單分子分辨率下數(shù)千堿基長度的染色質(zhì)狀態(tài),通過比較ecDNA和線性基因組DNA中的單分子水平的染色質(zhì)信號(hào)分布,觀察到線性DNA和ecDNA中的多種染色質(zhì)可及性狀態(tài),線性DNA (chr10: 4238321 – 42389251)的染色質(zhì)結(jié)構(gòu)采用兩種不同的構(gòu)象:一種是核小體不活動(dòng)狀態(tài),另一種是由于極高的轉(zhuǎn)錄活性而基本缺乏核小體的狀態(tài),而ecDNA中觀察到具有高度異質(zhì)性的核小體耗盡/占據(jù)模式,在bulk ATAC-seq中則無法獲得不同狀態(tài)下分子的表觀異質(zhì)性(圖11)。接下來,通過評(píng)估核小體定位相關(guān)性研究了ecDNA和線性基因組DNA的共可及性模式,與線性DNA相比,ecDNA中的核小體具有更高的相關(guān)性,并且ecDNA中的作用距離更遠(yuǎn),表現(xiàn)出遠(yuǎn)程染色質(zhì)相互作用(圖12)。
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖11 線性DNA與ecDNA單分子水平的染色質(zhì)信號(hào)分布A. 如圖所示是覆蓋線性DNA區(qū)域chr10: 4238321 – 42389201的所有reads。方框突出顯示了活性和非活性染色質(zhì);B. 顯示的是覆蓋ecDNA區(qū)域chr10: 42383201 – 42389201的所有reads
新技術(shù)!ecDNA與線性DNA的表觀遺傳差異研究迎來重要進(jìn)展-肽度TIMEDOO
圖12 線性DNA與ecDNA的染色質(zhì)共可及性概況(chr16:46407201 – 46410201)
02總結(jié)
總體來說,利用CCDA-seq,觀察到了開放染色質(zhì)區(qū)域中ecDNA的多樣性,在數(shù)千堿基長度尺度上定位到了核小體的分布,以及量化了單分子分辨率下遠(yuǎn)端調(diào)控元件的染色質(zhì)狀態(tài)的相關(guān)性,揭示了單分子水平線性DNA與ecDNA不同的染色質(zhì)狀態(tài)。CCDA-seq有助于更全面地了解ecDNA表觀基因組的調(diào)控,為ecDNA調(diào)控的獨(dú)特機(jī)制提供深入的見解。
參考文獻(xiàn):[1] Wu S, Turner KM, Nguyen N, Raviram R, Erb M, Santini J, et al. Circular ecDNA promotes accessible chromatin and high oncogene expression. Nature. 2019;575(7784):699-703.[2] Turner KM, Deshpande V, Beyter D, Koga T, Rusert J, Lee C, et al. Extrachromosomal oncogene amplification drives tumour evolution and genetic heterogeneity. Nature. 2017;543(7643):122-5.

[3] Paulsen T, Kumar P, Koseoglu MM, Dutta A. Discoveries of Extrachromosomal Circles of DNA in Normal and Tumor Cells. Trends Genet. 2018;34(4):270-8.

[4] Verhaak RGW, Bafna V, Mischel PS. Extrachromosomal oncogene amplification in tumour pathogenesis and evolution. Nature Reviews Cancer. 2019;19(5):283-8 %@ 1474-768.

[5] Deshpande V, Luebeck J, Nguyen N-PD, Bakhtiari M, Turner KM, Schwab R, et al. Exploring the landscape of focal amplifications in cancer using AmpliconArchitect. Nature communications. 2019;10(1):1-14 %@ 2041-1723.

[6] Prada-Luengo I, Krogh A, Maretty L, Regenberg B. Sensitive detection of circular DNAs at single-nucleotide resolution using guided realignment of partially aligned reads. BMC Bioinformatics. 2019;20(1):663.

[7] Kumar P, Kiran S, Saha S, Su Z, Paulsen T, Chatrath A, et al. ATAC-seq identifies thousands of extrachromosomal circular DNA in cancer and cell lines. Science Advances. 2020;6(20):eaba2489 %@ 375-548.

[8] Lee I, Razaghi R, Gilpatrick T, Molnar M, Gershman A, Sadowski N, et al. Simultaneous profiling of chromatin accessibility and methylation on human cell lines with nanopore sequencing. Nat Methods. 2020;17(12):1191-9.

[9] Shipony Z, Marinov GK, Swaffer MP, Sinnott-Armstrong NA, Skotheim JM, Kundaje A, et al. Long-range single-molecule mapping of chromatin accessibility in eukaryotes. Nat Methods. 2020;17(3):319-27.

[10] Stergachis AB, Debo BM, Haugen E, Churchman LS, Stamatoyannopoulos JA. Single-molecule regulatory architectures captured by chromatin fiber sequencing. Science. 2020;368(6498):1449-54 %@ 0036-8075.