為了實(shí)現(xiàn)精準(zhǔn)醫(yī)療,許多國(guó)家已經(jīng)開展本地人群的全基因組測(cè)序(WGS)研究。不過,目前的WGS資源主要來自歐洲人,而亞洲基因組在公共數(shù)據(jù)庫(kù)中的代表性不足。

為此,新加坡科技研究局(A*STAR)領(lǐng)導(dǎo)的團(tuán)隊(duì)對(duì)新加坡的中國(guó)人、馬來人和印度人三個(gè)群體開展了大規(guī)模測(cè)序,并在《Cell》雜志上發(fā)表了題為“Large-Scale Whole-Genome Sequencing of Three Diverse Asian Populations in Singapore”的文章。

“新加坡三個(gè)主要種族提供了東南亞地區(qū)遺傳多樣性的獨(dú)特快照,”作者在文中寫道。這篇文章的通訊作者包括華中科技大學(xué)的王超龍教授和新加坡國(guó)立大學(xué)的劉建軍教授,他們同時(shí)隸屬于新加坡科技研究局。

Cell:新加坡三個(gè)亞洲人群的大規(guī)模測(cè)序-肽度TIMEDOO

SG10K聯(lián)盟的成員對(duì)新加坡的4,810名中國(guó)人、馬來人和印度人進(jìn)行了測(cè)序,發(fā)現(xiàn)了9,830萬個(gè)新穎的或已知的多態(tài)性,可用來評(píng)估亞洲血統(tǒng)在這些族裔中的比例。他們還追蹤了至少20個(gè)表現(xiàn)出自然選擇跡象的基因座,其中14個(gè)與復(fù)雜性狀和疾病相關(guān)聯(lián)。

基于這些研究,作者認(rèn)為“對(duì)新加坡人的全基因組測(cè)序有望讓整個(gè)亞洲以及世界其他地區(qū)的人群受益”。他們預(yù)計(jì),“SG10K的數(shù)據(jù)將成為寶貴的資源,可推動(dòng)亞洲人的遺傳性狀和復(fù)雜疾病研究,并緩解目前人類遺傳學(xué)研究中的群體差異”。

這項(xiàng)研究屬于新加坡萬人基因組測(cè)序計(jì)劃的早期階段。在此,研究人員對(duì)4,800多人進(jìn)行測(cè)序,平均測(cè)度深度達(dá)13.7倍。參與者包括2,780名中國(guó)人、903名馬來人和1,127名印度人,來自8個(gè)不同的隊(duì)列。

在剔除了不符合質(zhì)量控制標(biāo)準(zhǔn)的變異后,他們獲得了8,910萬個(gè)SNP和910萬個(gè)小的插入缺失(indel)。其中,大約4,560萬個(gè)SNP和630萬個(gè)indel未曾出現(xiàn)在以往的群體研究中。

研究人員將1,200多名個(gè)體以往的基因型數(shù)據(jù)與此次分析的結(jié)果進(jìn)行比較,確認(rèn)了這些變異的質(zhì)量,然后才深入研究芯片未覆蓋的罕見變異。通過這種方式,他們記錄了2,525名健康個(gè)體的變異數(shù)量和類型,包括與隱性疾病風(fēng)險(xiǎn)相關(guān)的變異。

通過主成分分析(PCA),研究人員發(fā)現(xiàn)新加坡中國(guó)人和新加坡印度人分別與東亞人和南亞人重疊,而新加坡馬來人與其他群體相對(duì)較遠(yuǎn),這意味著馬來人代表了東南亞的土著人。同時(shí),他們還追溯了新加坡各個(gè)人群的起源。

考慮到SG10K的數(shù)據(jù)將成為亞洲人群數(shù)據(jù)的寶貴資源,研究人員接著評(píng)估了數(shù)據(jù)集的有效性?!凹词共捎脟?yán)格的標(biāo)準(zhǔn),我們也能夠檢測(cè)到亞洲人群以往報(bào)道的許多基因座,”他們寫道。這些結(jié)果凸顯了SG10K數(shù)據(jù)將成為推動(dòng)亞洲人群遺傳學(xué)研究的寶貴資源。

來源:生物通

原文檢索

Large-Scale Whole-Genome Sequencing of Three Diverse Asian Populations in Singapore

Cell? VOLUME 179, ISSUE 3, P736-749.E15, OCTOBER 17, 2019