北京生科院環(huán)形RNA數(shù)據(jù)挖掘新技術(shù)研究獲進(jìn)展
3月12日,中國(guó)科學(xué)院北京生命科學(xué)研究院研究員趙方慶團(tuán)隊(duì)在Nature Biotechnology上發(fā)表了題為Comprehensive profiling of circular RNAs with nanopore sequencing and CIRI-long的論文,研究?jī)?nèi)容為高效測(cè)定環(huán)形RNA全長(zhǎng)轉(zhuǎn)錄本的實(shí)驗(yàn)和計(jì)算方法。該研究主要是利用隨機(jī)引物對(duì)環(huán)形RNA進(jìn)行的滾環(huán)反轉(zhuǎn)錄擴(kuò)增,而后應(yīng)用納米孔測(cè)序技術(shù)對(duì)環(huán)形RNA的全長(zhǎng)序列進(jìn)行直接測(cè)序,并使用開發(fā)的CIRI-long算法識(shí)別長(zhǎng)測(cè)序讀段中的環(huán)形RNA序列并進(jìn)行全長(zhǎng)重構(gòu)。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的環(huán)形RNA二代測(cè)序技術(shù)相比,該方法將環(huán)形RNA檢測(cè)靈敏度提升了20倍,并可實(shí)現(xiàn)對(duì)不同長(zhǎng)度(<100bp-5kb)的環(huán)形RNA全長(zhǎng)序列的無偏識(shí)別,大幅提升了環(huán)形轉(zhuǎn)錄本的重構(gòu)能力,為其功能研究提供了重要的實(shí)驗(yàn)方法和計(jì)算工具。
環(huán)形RNA是一類在真核生物中廣泛存在的具有特殊環(huán)狀結(jié)構(gòu)的RNA分子。研究表明,在生物體內(nèi),環(huán)形RNA主要通過其序列特征,發(fā)揮miRNA海綿、RBP海綿及翻譯短肽等重要的生物學(xué)功能。因而環(huán)形RNA的全長(zhǎng)序列確定是進(jìn)行環(huán)形RNA功能研究的重要基礎(chǔ)。由于環(huán)形RNA的內(nèi)部序列與線性mRNA分子高度相似,在數(shù)據(jù)中很難區(qū)分來自環(huán)形RNA和線性RNA分子的讀段。研究方法對(duì)于環(huán)形RNA結(jié)構(gòu)的識(shí)別能力主要被二代測(cè)序的讀長(zhǎng)所限制,對(duì)于長(zhǎng)度較長(zhǎng)(>500bp)的環(huán)形RNA分子,仍缺少有效的全長(zhǎng)重構(gòu)手段。
針對(duì)這一問題,研究團(tuán)隊(duì)構(gòu)建并優(yōu)化環(huán)形RNA建庫(kù)流程,使用隨機(jī)引物對(duì)環(huán)形RNA進(jìn)行滾環(huán)反轉(zhuǎn)錄擴(kuò)增,結(jié)合片段長(zhǎng)度篩選(~1kb),針對(duì)長(zhǎng)度更長(zhǎng)的目標(biāo)cDNA片段進(jìn)行富集,最后使用納米孔測(cè)序技術(shù),實(shí)現(xiàn)了對(duì)目標(biāo)環(huán)形RNA的全長(zhǎng)序列進(jìn)行直接測(cè)定。同時(shí),研究人員進(jìn)一步開發(fā)了CIRI-long算法,識(shí)別納米孔測(cè)序數(shù)據(jù)中的環(huán)形RNA結(jié)構(gòu),并使用偏序比對(duì)算法,校正納米孔測(cè)序帶來的測(cè)序錯(cuò)誤。隨后,CIRI-long基于基因注釋和剪接信號(hào)信息,提供單一樣本內(nèi)和多樣本間結(jié)果的整合與校正方法,實(shí)現(xiàn)了環(huán)形RNA的準(zhǔn)確識(shí)別和全長(zhǎng)重構(gòu)。
為了評(píng)估CIRI-long方法的準(zhǔn)確性和效率,研究人員利用模擬數(shù)據(jù)和多次實(shí)驗(yàn)重復(fù),綜合評(píng)估CIRI-long結(jié)果,發(fā)現(xiàn)該方法具有較高的靈敏度,且與實(shí)驗(yàn)結(jié)果保持了高度的一致性。同時(shí),結(jié)合二代測(cè)序結(jié)果及公共數(shù)據(jù)庫(kù)的全面分析,表明CIRI-long可有效地對(duì)高表達(dá)環(huán)形RNA進(jìn)行識(shí)別,且與二代測(cè)序方法相比,CIRI-long對(duì)環(huán)形RNA的檢測(cè)效率有著近20倍的提升,對(duì)表達(dá)豐度較低的環(huán)形RNA有著更好的識(shí)別效果,同時(shí)可以識(shí)別到長(zhǎng)度更長(zhǎng)的環(huán)形RNA分子,大幅提升了環(huán)形RNA全長(zhǎng)的檢測(cè)能力。
利用該方法,研究進(jìn)一步發(fā)現(xiàn)了一類由內(nèi)含子自連形成的新型環(huán)形RNA分子(Intronic self-ligated circRNA)。這類環(huán)形RNA具有特殊的剪接位點(diǎn)內(nèi)側(cè)的GT-AG信號(hào)和較高的兩側(cè)序列保守性,在之前工作中缺乏普遍研究。此外,研究人員在小鼠不同組織中,對(duì)內(nèi)含子自連型環(huán)形RNA的表達(dá)模式開展了進(jìn)一步探究,發(fā)現(xiàn)Tpm1基因可以產(chǎn)生一個(gè)長(zhǎng)度為767bp的內(nèi)含子自連型環(huán)形RNA——circTpm1。與Tpm1基因的其他內(nèi)含子相比,該分子成環(huán)區(qū)域具有相對(duì)較高的保守性,且與線性mRNA在組織間具有不同的表達(dá)模式,說明circTpm1并非其母本基因轉(zhuǎn)錄的副產(chǎn)物,可能具有一定的生物學(xué)功能。
綜上,研究人員開發(fā)了基于納米孔測(cè)序技術(shù)的環(huán)形RNA全長(zhǎng)識(shí)別流程CIRI-long,通過結(jié)合滾環(huán)反轉(zhuǎn)錄擴(kuò)增和納米孔長(zhǎng)讀長(zhǎng)測(cè)序技術(shù),可直接測(cè)定環(huán)形RNA的全長(zhǎng)序列,實(shí)現(xiàn)了對(duì)環(huán)形RNA的高靈敏度檢測(cè)和內(nèi)部結(jié)構(gòu)重構(gòu)。與傳統(tǒng)的二代測(cè)序方法相比,CIRI-long大幅提升了環(huán)形RNA全長(zhǎng)重構(gòu)能力,并可實(shí)現(xiàn)與二代測(cè)序相近的分析成本。同時(shí),CIRI-long提供了樣本間整合分析的工具,并針對(duì)納米孔測(cè)序的高錯(cuò)誤率建立了有效校正方法,為環(huán)形RNA的功能研究提供了重要的方法學(xué)工具,具有很高的應(yīng)用價(jià)值。
該研究工作由趙方慶團(tuán)隊(duì)完成,獲得國(guó)家杰出青年科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃及中科院的支持。趙方慶團(tuán)隊(duì)在前期的工作中建立了環(huán)形RNA識(shí)別、可變剪接檢測(cè)及定量等方法,相關(guān)研究發(fā)表在Nature Biotechnology(2021)、Nature Communications(2016,2020)、Genome Biology(2015,2020)、Briefings in Bioinformatics(2018)、Trends in Genetics(2018)、Genome Medicine(2019)、Cell Reports(2019)和Bioinformatics(2020)上。這些研究成果豐富了我們對(duì)環(huán)形RNA的組成及結(jié)構(gòu)的認(rèn)識(shí),為深入了解這一類特殊的RNA分子提供了重要工具和數(shù)據(jù)支持。
圖1.環(huán)形RNA全長(zhǎng)重構(gòu)的實(shí)驗(yàn)與計(jì)算流程
圖2.基于納米孔測(cè)序全面揭示環(huán)形RNA的多樣性
來源:中科院

