2020年10月19日,國際學(xué)術(shù)期刊Nucleic Acids Research在線發(fā)布了中國科學(xué)院上海營養(yǎng)與健康研究所(中國科學(xué)院-馬普學(xué)會計算生物學(xué)伙伴研究所)王澤峰課題組與生物醫(yī)學(xué)大數(shù)據(jù)中心合作開發(fā)的專門提供各類支持環(huán)狀RNA (circRNAs)翻譯證據(jù)的數(shù)據(jù)庫TransCirchttps://www.biosino.org/transcirc/),該數(shù)據(jù)庫通過整合多種組學(xué)數(shù)據(jù)來預(yù)測特定環(huán)狀RNA編碼蛋白質(zhì)的潛力并推斷其翻譯產(chǎn)物。文章題為“TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence”。

環(huán)形RNA是一類由反向剪接形成的具有共價閉環(huán)解構(gòu)的RNA,在真核生物中具有廣泛表達(dá)且保守的特點(diǎn)。由于其序列與對應(yīng)線性RNA大部分重合,因此可以天然通過結(jié)合miRNA或RNA結(jié)合蛋白(RBP)來調(diào)控親本基因的表達(dá)。近年來的研究發(fā)現(xiàn),定位在細(xì)胞質(zhì)中由外顯子構(gòu)成的環(huán)形RNA也可以發(fā)揮類似mRNA的作用來指導(dǎo)蛋白質(zhì)的翻譯,這類非帽依賴性翻譯通常在應(yīng)激反應(yīng)(如癌癥發(fā)生過程)中上調(diào),是細(xì)胞在翻譯水平上改變應(yīng)激反應(yīng)途徑的重要表現(xiàn)。

隨著測序技術(shù)的發(fā)展,目前有大量的環(huán)形RNA被鑒定出來,與之不匹配的是為數(shù)不多的注釋數(shù)據(jù)庫,TransCirc就是針對這一需求構(gòu)建的基于多組學(xué)證據(jù)的環(huán)狀RNA翻譯數(shù)據(jù)庫。目前,TransCirc中收錄了328080條人類環(huán)狀RNA信息和七類相關(guān)證據(jù),其中:1) 核糖體譜(ribosome profiling)鑒定出與核糖體結(jié)合的環(huán)狀RNA共4284條;2) 含實驗鑒定的翻譯起始位點(diǎn)(TIS)、內(nèi)部核糖體進(jìn)入位點(diǎn)(IRES)和N-6-甲基腺苷修飾位點(diǎn)(m6A)的環(huán)狀RNA分別有10058、314111和40324條;3) 274762條環(huán)狀RNA含環(huán)狀RNA特有編碼框(ORF),其推斷翻譯產(chǎn)物中機(jī)器學(xué)習(xí)預(yù)測可形成穩(wěn)定蛋白質(zhì)和含質(zhì)譜數(shù)據(jù)(MS)直接支持的分別有194927和168條。除以上數(shù)據(jù)外,TransCirc還提供了友好的搜索/瀏覽界面及輔助分析軟件。TransCirc作為研究環(huán)狀RNA翻譯能力及其編碼肽段功能的重要資源,未來將收錄更多相關(guān)組學(xué)數(shù)據(jù)并將擴(kuò)展覆蓋到其他非人物種。

中國科學(xué)院上海營養(yǎng)與健康研究所王澤峰研究員和張國慶研究員為文章的共同通訊作者,黃文娣和凌鋆超為共同第一作者。上述研究工作得到了科技部國家重點(diǎn)研發(fā)計劃、中國科學(xué)院、國家自然科學(xué)基金委和上海市科學(xué)技術(shù)委員會等經(jīng)費(fèi)的支持。(科技處)

原文標(biāo)題:

TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaa823/5930392

來源:中科院