基因本體學(xué)聯(lián)盟發(fā)布全新基因功能知識庫
基因本體學(xué)(Gene Ontology,GO)聯(lián)盟近日發(fā)布了一個全新的資源,提供了關(guān)于所有蛋白質(zhì)編碼人類基因功能的全面百科全書。該資源首次通過大規(guī)模的進(jìn)化建模,將人類基因數(shù)據(jù)與其他物種的遺傳數(shù)據(jù)相結(jié)合,整合了現(xiàn)有的最準(zhǔn)確、最完整的基因功能證據(jù),形成了一個可搜索的公共資源,涵蓋了超過20,000個基因的已知功能。該成果已在《自然》雜志上發(fā)表。
作為一個已經(jīng)擴(kuò)展和改進(jìn)超過25年的知識庫,基因本體學(xué)已成為生物醫(yī)學(xué)研究的核心工具。每年,全球超過30,000篇學(xué)術(shù)論文依賴該知識庫進(jìn)行數(shù)據(jù)分析和解讀。
在“組學(xué)”實驗中,生物醫(yī)學(xué)研究人員通過大規(guī)模的DNA、RNA、蛋白質(zhì)等生物分子的研究,生成能夠識別出成百上千個相關(guān)基因的數(shù)據(jù)。例如,研究人員可能會發(fā)現(xiàn)癌細(xì)胞與健康細(xì)胞相比,哪些基因被激活或關(guān)閉。然而,查閱每個基因已知功能的數(shù)千篇文獻(xiàn)顯然不現(xiàn)實,因此,很多科學(xué)家轉(zhuǎn)而使用基因本體學(xué)。
“我們的知識庫幫助科學(xué)家從單純的基因列表出發(fā),深入了解這些基因的生物學(xué)功能,包括可能對治療有用的方面,”基因本體學(xué)聯(lián)盟的首席研究員、凱克醫(yī)學(xué)院的生物信息學(xué)部主任、公共衛(wèi)生與流行病學(xué)教授Paul D. Thomas博士表示。
進(jìn)化視角的創(chuàng)新
此次發(fā)布的新資源“PAN-GO功能組”(PAN-GO functionome)使用進(jìn)化建模方法,通過將來自人類基因的實驗數(shù)據(jù)與來自小鼠、斑馬魚等模式生物的基因數(shù)據(jù)結(jié)合,進(jìn)一步完善了人類基因功能的知識圖譜。該方法不僅填補了因缺乏直接的實驗數(shù)據(jù)而存在的知識空白,還提供了關(guān)于基因功能更為完整、準(zhǔn)確的描述。
Thomas博士解釋說:“我們此前已經(jīng)積累了龐大的基因功能知識庫,成為了關(guān)于人類基因功能的權(quán)威參考。如今,通過加入關(guān)于每個基因功能在進(jìn)化中出現(xiàn)的時間點,我們提供了更為完整、準(zhǔn)確、簡潔的基因功能描述?!?/p>
全球合作與持續(xù)更新
此次資源的整理是由來自全球150多名生物學(xué)家共同完成的,包括來自凱克醫(yī)學(xué)院的團(tuán)隊。自1998年起,研究人員已審閱超過17.5萬篇有關(guān)基因功能的學(xué)術(shù)文章,搜集了關(guān)于人類基因功能的數(shù)據(jù),特別是超過20,000個蛋白質(zhì)編碼基因所控制的關(guān)鍵生物過程。研究團(tuán)隊將這些基因根據(jù)它們執(zhí)行的生物學(xué)功能進(jìn)行分類,從而開發(fā)出一個涵蓋細(xì)胞分裂、細(xì)胞信號傳導(dǎo)、免疫反應(yīng)、分子運輸?shù)榷喾N功能的目錄。
科學(xué)家們強調(diào),精準(zhǔn)了解基因功能,尤其是涉及基因組中的某些基因在不同疾病中的作用,可以幫助研究人員理解癌癥等疾病的發(fā)生機制,并設(shè)計針對性的治療策略。
功能組的應(yīng)用前景
“PAN-GO功能組”將與傳統(tǒng)的基因本體學(xué)資源一樣,被科研界廣泛用于“組學(xué)”數(shù)據(jù)分析等應(yīng)用,且它能提供更加準(zhǔn)確的結(jié)果。因為這項新工作將所有的信息通過大規(guī)模的進(jìn)化模型進(jìn)行整合,使得基因功能的描述更加完整和精確。
對于沒有直接實驗數(shù)據(jù)的基因,研究人員通過研究小鼠、大鼠、斑馬魚、果蠅、酵母菌或大腸桿菌等模型生物的基因,結(jié)合進(jìn)化時間點的信息,可以推測人類基因的功能特性。例如,某些功能如能量代謝或細(xì)胞信號傳導(dǎo)的功能可能在進(jìn)化過程中早已形成,這為人類基因功能的研究提供了新視角。
未來展望與共同建設(shè)
基因本體學(xué)聯(lián)盟表示,未來將鼓勵科研人員在他們的分析中使用“PAN-GO功能組”。該資源已經(jīng)以機器可讀格式構(gòu)建,能夠支持科學(xué)家使用計算工具(如人工智能)快速查找和使用這些數(shù)據(jù)。
同時,聯(lián)盟還發(fā)起了號召:研究人員可以通過該項目網(wǎng)站提交建議,幫助更新和完善基因功能的知識庫。通過眾包方式獲取基因功能的知識,并將其結(jié)構(gòu)化分類,確保這一共享資源在未來持續(xù)改進(jìn),并便于應(yīng)用。
雖然這是目前關(guān)于基因功能最全面的資源,”PAN-GO功能組”仍未完全涵蓋所有基因。它目前包含了82%的蛋白質(zhì)編碼基因的功能數(shù)據(jù),但仍有18%(約3,600個基因)的生物功能未知。
Thomas博士表示:“我們現(xiàn)在已經(jīng)清楚地看到哪些地方缺乏信息,這也為未來研究的方向提供了指引?!?/p>
參考文獻(xiàn):Paul Thomas, A compendium of human gene functions derived from evolutionary modelling,?Nature?(2025).?DOI: 10.1038/s41586-025-08592-0
www.nature.com/articles/s41586-025-08592-0
編輯:周敏
排版:李麗


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。