12月6日,《科學(xué)》在線發(fā)表了西湖大學(xué)生命科學(xué)學(xué)院、西湖實(shí)驗(yàn)室教授俞曉春團(tuán)隊最新成果“完整的端粒到端粒小鼠參考基因組序列”,報道了該團(tuán)隊在解析小鼠參考基因組方面取得的重要突破。這意味著人類歷史上第一次看清了小鼠基因組DNA全貌。

目前小鼠的基因“檔案”中,最完整的是參考基因組GRCm39,同樣也存在約7~8%未被解析的區(qū)域。小鼠是生命科學(xué)研究中最常見的實(shí)驗(yàn)動物和模式生物,這是因?yàn)樵S多生物實(shí)驗(yàn)不宜在人體內(nèi)進(jìn)行,因此,小鼠的基因組DNA信息直接關(guān)系到人類健康的探索。

俞曉春團(tuán)隊綜合了眾多三代基因測序技術(shù),讓它們互相補(bǔ)足,開發(fā)了一把能夠充分挖掘小鼠基因的“金鏟子”。他們以最常用的小鼠C57BL/6的單倍體胚胎干細(xì)胞為樣本,進(jìn)行了基因測序和組裝,獲得了長度為2.77 Gbp(表示十億個堿基對)的完整的高質(zhì)量小鼠參考基因組序列,其中包含215.23 Mbp(表示一百萬個堿基對)先前未被鑒定的序列,填補(bǔ)了約7.7%的基因組空白。

俞曉春表示,在這項研究中,團(tuán)隊發(fā)現(xiàn)了新的蛋白質(zhì)編碼基因。與先前的參考基因組版本相比,本研究額外注釋了639個蛋白質(zhì)編碼基因,其中先前未被發(fā)現(xiàn)的全新的蛋白質(zhì)編碼基因有140個。這些新的蛋白質(zhì)編碼基因可能參與多種生物學(xué)過程,為未來的研究提供了新的方向。

研究較精確地“看清”了核糖體DNA的基因序列。核糖體是細(xì)胞內(nèi)的“蛋白質(zhì)工廠”,負(fù)責(zé)合成蛋白質(zhì)。核糖體DNA是細(xì)胞中的一種特殊DNA,它專門負(fù)責(zé)編碼核糖體的RNA(rRNA)——一種核糖體的重要組成部分,幫助核糖體合成蛋白。用簡潔的比擬來說,核糖體DNA給出了細(xì)胞內(nèi)rRNA的“藍(lán)圖”。這個發(fā)現(xiàn)為進(jìn)一步解析核糖體潛在的蛋白質(zhì)翻譯功能的差異性提供參考。

此外,研究還解析了著絲粒區(qū)域的基因序列詳情。本研究的結(jié)果顯示,小鼠各染色體之間的著絲粒長度具有明顯差異,且序列內(nèi)部富含轉(zhuǎn)座元件和片段重復(fù),同時還有散在的基因分布,表明該區(qū)域可能會進(jìn)行活躍的轉(zhuǎn)錄和轉(zhuǎn)座事件,驅(qū)動著絲粒區(qū)域進(jìn)行適應(yīng)性改變等行為。對著絲粒區(qū)域的解析,有助于理解因著絲粒功能缺陷導(dǎo)致的染色體重排、非整倍性等相關(guān)疾病的發(fā)病機(jī)制。

西湖實(shí)驗(yàn)室助理研究員劉俊麗和李麒麟為論文共同第一作者,俞曉春為通訊作者。

相關(guān)論文信息:https://www.science.org/doi/10.1126/science.adq8191

來源:《科學(xué)》