華大等機(jī)構(gòu)有關(guān)363種鳥(niǎo)類(lèi)基因組數(shù)據(jù)研究登《Nature》封面!進(jìn)一步揭示基因組多樣性演化奧秘
2020年11月12日,深圳華大生命科學(xué)研究院生物多樣性團(tuán)隊(duì)、昆明動(dòng)物研究所等單位聯(lián)合在《自然》(Nature)上同期以封面形式發(fā)表了兩篇文章報(bào)道萬(wàn)種鳥(niǎo)類(lèi)基因組計(jì)劃第二階段(科級(jí)別)最新研究結(jié)果。研究團(tuán)隊(duì)發(fā)表了363種鳥(niǎo)類(lèi)基因組數(shù)據(jù),同時(shí)通過(guò)這一數(shù)據(jù)建立了無(wú)參考序列下多基因組比對(duì)和分析的新方法,并基于這一新方法闡明高密度物種取樣對(duì)生物多樣性研究的重要性,為深入了解基因組多樣性演化奧秘提供了契機(jī)。
Nature 雜志封面
(圖片來(lái)自Nature官網(wǎng))
建立無(wú)參考序列的基因組比對(duì)算法Cactus
傳統(tǒng)的比較基因組學(xué)分析依賴于某個(gè)基因組作為參考序列建立全基因組比對(duì),進(jìn)而開(kāi)展相關(guān)的比較分析。這一方法存在兩個(gè)弊端,一是因?yàn)槭苤朴趨⒖蓟蚪M而無(wú)法識(shí)別出其他物種特異序列或者其他物種之間的差異序列,二是因?yàn)橹猾@取單拷貝同源區(qū)域而丟失了由分支特異復(fù)制事件所帶來(lái)的一比多或多比多的同源區(qū)域。在多物種比較分析中,由于基因復(fù)制、序列丟失或獲得、染色體結(jié)構(gòu)變異等事件存在的情況下,如何獲取更真實(shí)且全面的序列同源關(guān)系用于后續(xù)系統(tǒng)發(fā)生關(guān)系的解析和比較基因組學(xué)相關(guān)分析尤為關(guān)鍵。
針對(duì)此問(wèn)題,研究團(tuán)隊(duì)建立了適用于多物種且無(wú)參基因組的比對(duì)算法——Cactus。該算法基于預(yù)設(shè)的物種關(guān)系樹(shù),將復(fù)雜的多序列比對(duì)問(wèn)題分解到物種分支上,對(duì)每個(gè)分支上的物種開(kāi)展兩兩比對(duì)并構(gòu)建出其祖先基因組序列,而后再基于祖先序列將更多分支的物種基因組排比在一起,從而構(gòu)建出無(wú)參考序列的多基因組比對(duì)信息。
這一方法成功的解決了現(xiàn)有多序列比對(duì)軟件的弊端,也極大的提高了跨物種的比對(duì)效率,減少了由于與參考物種遺傳距離差異引起的比對(duì)偏好和序列丟失。例如,363只鳥(niǎo)類(lèi)基因組構(gòu)建的全基因組比對(duì)序列總長(zhǎng)為981Mb,比之前以雞和斑胸草雀為參考基因組構(gòu)建的48只鳥(niǎo)類(lèi)全基因組比對(duì)序列在長(zhǎng)度上提升了149%。深圳國(guó)家基因庫(kù)張國(guó)捷教授和加州大學(xué)圣克魯斯分校的Benedict Paten共同為文章的通訊作者。
高密度物種取樣,覆蓋鳥(niǎo)類(lèi)92%的科階元
無(wú)參基因組比較完整描繪鳥(niǎo)類(lèi)物種譜系基因組動(dòng)態(tài)演化圖譜
無(wú)參的全基因組比對(duì)數(shù)據(jù)集為全面解析鳥(niǎo)類(lèi)遺傳多樣性特征的演化歷程和分子遺傳機(jī)制提供了全新的切入點(diǎn)。在另外一篇文章中,研究團(tuán)隊(duì)借助Cactus這一算法的優(yōu)勢(shì)建立了更加完善的同源基因集合,還開(kāi)發(fā)了一套鑒定任意演化分支特異獲得和丟失序列的方法,從而完整描繪出鳥(niǎo)類(lèi)物種譜系基因組動(dòng)態(tài)演化圖譜。
研究發(fā)現(xiàn)這些動(dòng)態(tài)變化的基因組區(qū)域往往存在一些分支特異基因或調(diào)控元件,可能與物種特異性狀的起源和演化有關(guān)。比如,雀形目鳥(niǎo)類(lèi)基因組多出一個(gè)生長(zhǎng)激素基因的拷貝。雀形目中的鳴禽丟失了Cornulin?基因,該基因所編碼的蛋白主要位于食管和口腔上皮細(xì)胞,其缺失可能會(huì)引起食管上皮的粘彈性特性發(fā)生變化,進(jìn)而使得食管上部直徑可以產(chǎn)生快速變化來(lái)調(diào)整的聲道,這可能與其多樣化的純音發(fā)聲演化有關(guān)。
此外,研究發(fā)現(xiàn)基于高覆蓋度的物種取樣的基因組比較分析顯著提高了對(duì)基因組序列保守性的檢驗(yàn)效力,實(shí)現(xiàn)了在單堿基分辨度下的自然選擇壓力分析。相比于53個(gè)物種的比較分析,363個(gè)物種計(jì)算得到的單堿基保守位點(diǎn)從2.1%上升到13.2%。
“在少量物種的比較分析中,我們只能通過(guò)嚴(yán)格篩選演化速率近乎為0的基因組區(qū)域作為超保守區(qū)域,因此只能檢測(cè)出受到強(qiáng)烈自然選擇的基因組區(qū)域。而高覆蓋度的物種比較分析可以極大提高對(duì)基因組選擇壓力的檢測(cè)靈敏度,以鳥(niǎo)類(lèi)現(xiàn)有數(shù)據(jù)來(lái)看,我們可以在低于中性演化水平50%左右的演化速率下即可檢測(cè)出受到自然選擇的區(qū)域。”B10K項(xiàng)目發(fā)起人之一、來(lái)自深圳國(guó)家基因庫(kù)、深圳華大生命科學(xué)研究院和哥本哈根大學(xué)的張國(guó)捷教授強(qiáng)調(diào)說(shuō),“這些區(qū)域可能在演化過(guò)程中由于在某些物種分支上提供特殊適應(yīng)性功能,從而受到較弱的自然選擇壓力。因此這些區(qū)域?qū)沂疚锓N類(lèi)群的分化具有重要意義。”
關(guān)于萬(wàn)種鳥(niǎo)基因組學(xué)計(jì)劃
鳥(niǎo)類(lèi)是物種最豐富的動(dòng)物群體之一,它們幾乎出現(xiàn)在世界上的每一個(gè)棲息地。它們是第五次物種大滅絕后幸存下來(lái)的唯一的恐龍譜系,在適應(yīng)性大爆發(fā)后演化出超過(guò)10500個(gè)物種,展現(xiàn)出多樣的生態(tài)、形態(tài)和行為特征。在全基因組數(shù)據(jù)中,我們不僅可以找到物種演化歷程的印記,也可以基于此來(lái)預(yù)示物種的適應(yīng)潛能。
萬(wàn)種鳥(niǎo)基因組學(xué)計(jì)劃旨在構(gòu)建所有現(xiàn)生約10500種鳥(niǎo)類(lèi)的基因組圖譜,該項(xiàng)目由深圳國(guó)家基因庫(kù)、中國(guó)科學(xué)院、哥本哈根大學(xué)、史密森博物館、深圳華大生命科學(xué)研究院以及洛克菲勒大學(xué)共同主導(dǎo)。
目前發(fā)表的研究成果是該計(jì)劃第二階段科級(jí)別的最新研究成果??蒲袌F(tuán)隊(duì)從現(xiàn)存鳥(niǎo)類(lèi)的科階元中選取一個(gè)代表性鳥(niǎo)類(lèi)物種,共計(jì)獲得363只鳥(niǎo)類(lèi)的全基因組數(shù)據(jù)覆蓋92%的科階元,其中267個(gè)物種的基因組數(shù)據(jù)為首次發(fā)布。
項(xiàng)目所使用的樣品主要來(lái)源于全球多個(gè)博物館所保存的鳥(niǎo)類(lèi)組織樣品。其中美國(guó)史密森博物館、丹麥自然博物館和路易斯安那州立大學(xué)自然博物館為該項(xiàng)目貢獻(xiàn)了大部分樣品。這使得研究團(tuán)隊(duì)能夠?qū)σ恍┫∮械暮蜑l危的鳥(niǎo)類(lèi)物種進(jìn)行基因組測(cè)序,這將為物種保育提供重要的基因組資源。本研究中,首次發(fā)布的267個(gè)物種基因組使用華大基因自主研發(fā)的BGISEQ-500平臺(tái)測(cè)序完成。
相關(guān)論文信息
https://www.nature.com/articles/s41586-020-2873-9
https://www.nature.com/articles/s41586-020-2871-y
編輯:李麗


本文系作者 @華大集團(tuán) 授權(quán)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。