人類完整基因組高配“拼圖”完成
4月1日《科學(xué)》雜志封面:填補(bǔ)空缺。圖片來源:《科學(xué)》
4月1日,美國(guó)科學(xué)家領(lǐng)銜的國(guó)際合作團(tuán)隊(duì)在發(fā)表于《科學(xué)》的6篇論文中報(bào)告稱,有史以來最完整的人類基因組圖譜繪制完成。
20多年前,科學(xué)家發(fā)表了人類基因組草圖,破譯了“生命天書”。不過,當(dāng)時(shí)的序列尚不完整。此后遺傳學(xué)家持續(xù)改進(jìn),但仍有約8%的序列缺失或錯(cuò)誤。
現(xiàn)在,科學(xué)家揭開了最后的謎團(tuán),人類基因組圖譜的最后一塊拼圖終于補(bǔ)齊。
“人類基因組的這些部分,對(duì)我們理解基因組如何工作、遺傳疾病、人類多樣性和進(jìn)化非常重要。”該研究發(fā)起人之一、美國(guó)加利福尼亞大學(xué)圣克魯茲分校的Karen Miga在郵件中告訴《中國(guó)科學(xué)報(bào)》。
“零件”更齊全的“高配”汽車
科學(xué)家于1990年啟動(dòng)人類基因組測(cè)序項(xiàng)目,并于2001年公布了首個(gè)人類基因組草圖。
它使人們對(duì)人類生物學(xué)和疾病的理解取得巨大進(jìn)展。但因?yàn)榧夹g(shù)限制,最初公布的基因組序列并不完整。
“構(gòu)成人類23對(duì)染色體的DNA堿基對(duì)太長(zhǎng)了,當(dāng)時(shí)測(cè)序時(shí)總是要切割。切割后我們就遇到一個(gè)問題——人類遺傳密碼中有大量的重復(fù)序列?!敝袊?guó)科學(xué)院院士、國(guó)際人類基因組計(jì)劃參與者陳潤(rùn)生向《中國(guó)科學(xué)報(bào)》解釋道,其中一類是像“糖葫蘆”一樣串聯(lián)的重復(fù)序列,另一類則是散在的重復(fù)序列。
“如果串成串,你不知道它串的是99個(gè)重復(fù)還是100個(gè)重復(fù);散在的問題是不知道要把它接到哪一個(gè)具有重復(fù)基因的片段上?!标悵?rùn)生說,有人將這部分難測(cè)的基因形容為“夢(mèng)幻的”或“隱蔽的”基因。
2003年人類基因組計(jì)劃宣告完成之后,遺傳學(xué)家繼續(xù)對(duì)這部分隱蔽基因進(jìn)行改進(jìn),但仍有約8%的序列存在缺失或錯(cuò)誤?,F(xiàn)在,在新技術(shù)的支撐下,科學(xué)家終于破譯了最后一塊拼圖,繪制出缺失的部分。
新版本基因組被命名為T2T-CHM13。這有兩個(gè)緣由。一方面,它由“端粒到端?!保═2T)聯(lián)盟繪制。另一方面,研究人員是從一個(gè)被稱為CHM13的細(xì)胞系中讀取的DNA。該細(xì)胞系來自完全性葡萄胎——當(dāng)精子使一個(gè)沒有細(xì)胞核的卵子受精時(shí)在人體內(nèi)形成的組織,這種細(xì)胞可以在實(shí)驗(yàn)室中培養(yǎng)。
普通人類細(xì)胞的每段DNA都有兩個(gè)副本,一個(gè)來自母親,另一個(gè)來自父親,往往存在重大差異。當(dāng)科學(xué)家試圖組裝基因組片段時(shí),來自父母的序列可能會(huì)混合在一起,掩蓋了個(gè)體基因組中的實(shí)際變化。
使用CHM13就避免了這個(gè)問題。由此產(chǎn)生的細(xì)胞只含有來自父親的染色體?!斑@使我們看到了生命基因手稿中以前從未讀過的章節(jié)。”華盛頓大學(xué)霍華德·休斯醫(yī)學(xué)研究所研究員、T2T聯(lián)盟聯(lián)合主席Evan Eichler說。
T2T-CHM13被認(rèn)為是自人類參考基因組首次發(fā)布以來進(jìn)行的最大改進(jìn)。
據(jù)了解,它比上一個(gè)版本增加了近2億個(gè)堿基對(duì)以及2000多個(gè)新基因;繪制了更精確的五條染色體臂的圖譜,這將有助于人們進(jìn)一步增加對(duì)染色體的認(rèn)識(shí);覆蓋了基因組中最復(fù)雜的一些區(qū)域,包括在重要染色體結(jié)構(gòu)及其周圍發(fā)現(xiàn)的高度重復(fù)的DNA序列,如將兩條染色體連接在一起的著絲粒和為細(xì)胞的蛋白質(zhì)工廠提供指令核糖體的DNA;發(fā)現(xiàn)了人類基因組中200多萬個(gè)變異,為622個(gè)醫(yī)學(xué)相關(guān)的基因組變異提供了更準(zhǔn)確的信息。
“以前我們看到了90%以上的基因組,但還有許多重要方面隱藏在科學(xué)視野之外?,F(xiàn)在,我們可以站在山頂,看到山下所有的風(fēng)景,獲得人類基因資源的完整圖像?!奔永D醽喆髮W(xué)圣克魯茲分?;蚪M學(xué)研究所主任David Haussler說。
“假如把人類基因組序列比作一輛非常復(fù)雜的汽車,那么與20年前完成的人類基因組草圖相比,完整的新序列相當(dāng)于增添了更多零件?!睂?duì)此,人類基因組計(jì)劃參與者、中國(guó)科學(xué)院北京基因組研究所研究員于軍在接受《中國(guó)科學(xué)報(bào)》采訪時(shí)比喻說,“沒有它能跑,有它更好?!?/p>
“游戲規(guī)則的改變者”
過去10年間出現(xiàn)的第三代DNA測(cè)序“長(zhǎng)讀”技術(shù)是彌補(bǔ)8%空缺的“游戲規(guī)則的改變者”。
在T2T聯(lián)盟采用的兩種技術(shù)中,牛津納米孔DNA測(cè)序方法可以一次讀取100萬個(gè)DNA字母,但精度不高;而太平洋生物科學(xué)公司的測(cè)序方法可以一次讀取大約2萬個(gè)字母,精度近乎完美。這兩種測(cè)序方法的優(yōu)勢(shì)“疊加”生成了完整的人類基因組序列。
“這種技術(shù)的進(jìn)步是劃時(shí)代的,就像從蒸汽機(jī)發(fā)展到內(nèi)燃機(jī)再到信息化、智能化的大踏步前進(jìn)?!庇谲娬f,這是獲取完整序列的“后盾”。
“長(zhǎng)讀技術(shù)加上進(jìn)行基因組重建和質(zhì)量評(píng)估的創(chuàng)新方法,是這項(xiàng)努力成功的原因?!盡iga對(duì)記者說。
那么,中國(guó)相關(guān)技術(shù)儲(chǔ)備如何呢?
深圳華大生命科學(xué)研究院群體基因組學(xué)領(lǐng)域首席科學(xué)家金鑫向《中國(guó)科學(xué)報(bào)》表示,我國(guó)10年以前基本上依賴國(guó)外的基因測(cè)序設(shè)備,但在2015年開始擁有第一款真正的國(guó)產(chǎn)基因測(cè)序儀,目前擁有一款全球單日數(shù)據(jù)量產(chǎn)出最高的測(cè)序儀。
“在短讀長(zhǎng)(基因序列精讀)部分,我們已經(jīng)做到了與全球領(lǐng)先水平并駕齊驅(qū),相關(guān)錯(cuò)誤率僅有萬分之一,甚至是十萬分之一?!彼硎?,相關(guān)技術(shù)已經(jīng)非常穩(wěn)定。
在長(zhǎng)讀方面,他表示,國(guó)內(nèi)多家機(jī)構(gòu)正處于研發(fā)和追趕的階段,現(xiàn)在也有了一些突破。
神秘的著絲粒
對(duì)于此次人類基因組的新部分,研究人員特別感興趣的是神秘的著絲粒。它們是將兩條染色體連接在一起的密集的DNA束,在細(xì)胞分裂中起著關(guān)鍵作用。
“約90%的新序列實(shí)際上來自染色體的著絲粒。”描述著絲粒周圍堿基對(duì)序列論文的第一作者、加利福尼亞大學(xué)伯克利分校的博士后Nicolas Altemose介紹,著絲粒內(nèi)部及周圍的新DNA序列約占整個(gè)基因組的6.2%。
他和團(tuán)隊(duì)發(fā)現(xiàn),著絲粒的大型蛋白質(zhì)復(fù)合物牢牢抓住了染色體,這樣細(xì)胞核內(nèi)的其他機(jī)器就可以將染色體對(duì)分開。“一旦這一過程出錯(cuò),就會(huì)得到錯(cuò)誤的染色體分離,這將導(dǎo)致各種問題。如果這發(fā)生在減數(shù)分裂中,就意味著可能會(huì)發(fā)生染色體異常,導(dǎo)致自然流產(chǎn)或先天性疾病。如果它發(fā)生在體細(xì)胞中,可能會(huì)導(dǎo)致癌癥。”他說。
他們還以T2T-CHM13為框架,比較了來自世界各地的1600名個(gè)體的著絲粒DNA,發(fā)現(xiàn)了其周圍重復(fù)DNA的序列和拷貝數(shù)的主要差異,這可以用于追溯人類的譜系。
此外,完整的基因組也有助于提高科學(xué)家對(duì)不同人群個(gè)體基因組變異的理解力。
據(jù)介紹,T2T-CHM13將為人類參考基因組38 (GRCh38)提供補(bǔ)充。該基因組起源于人類基因組計(jì)劃,自2000年第一稿以來一直在更新。GRCh38并不代表任何一個(gè)個(gè)體,而是由多個(gè)捐贈(zèng)者的DNA組裝而成,被合并為一個(gè)線性序列。
Miga表示,單個(gè)基因組的成功完成并不是最后的定論。目前,T2T聯(lián)盟已與人類泛基因組參考聯(lián)盟合作,旨在對(duì)350個(gè)個(gè)體進(jìn)行全基因組測(cè)序,并基于此創(chuàng)建一個(gè)新的“人類泛基因組參考”,以“確保準(zhǔn)確地捕獲整個(gè)相關(guān)的基因組”。
于軍則向《中國(guó)科學(xué)報(bào)》表示,中國(guó)人的基因組與現(xiàn)有的完整白人基因組序列仍然存在較大差異,他希望我國(guó)盡快發(fā)展三代、四代測(cè)序技術(shù),測(cè)出完整的中國(guó)人基因組序列。
相關(guān)論文信息:
https://doi.org/10.1126/science.abj6987
https://doi.org/10.1126/science.abl3533
https://doi.org/10.1126/science.abj6965
https://doi.org/10.1126/science.abl4178
https://doi.org/10.1126/science.abk3112
https://doi.org/10.1126/science.abj5089
來源: 中國(guó)科學(xué)報(bào)


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。