學(xué)者開發(fā)出基因結(jié)構(gòu)注釋“拋光”工具
華南農(nóng)業(yè)大學(xué)園藝學(xué)院教授夏瑞團隊在國家自然科學(xué)基金等項目的資助下,開發(fā)了一種基于基因共線性進行物種基因組基因結(jié)構(gòu)注釋矯正的工具——SynGAP(Synteny-based Gene structure Annotation Polisher)。相關(guān)成果近日在線發(fā)表于《基因組生物學(xué)》(Genome Biology)。
SynGAP基因結(jié)構(gòu)注釋矯正的設(shè)計邏輯與流程。研究團隊 供圖
演化過程中,在具有共同祖先的近緣物種之間,染色體上同源基因存在保守排列的現(xiàn)象,被稱為基因共線性。近緣物種的基因共線性區(qū)塊中,部分基因丟失了與其對應(yīng)的共線性基因,進而在區(qū)塊內(nèi)形成共線性對的間隔。共線性基因的缺失,可能由基因組序列的變化引起的,同時還有可能是錯誤注釋或缺失的基因模型導(dǎo)致的。
基于后一種可能性,夏瑞團隊通過兩物種的共線性分析,檢測出共線性區(qū)塊中共線性對的空缺位置。隨后進行雙向的同源比對以實現(xiàn)對間隔內(nèi)潛在注釋錯漏的初步鑒定與矯正。再通過去冗余、可靠性指標(biāo)計算篩選、參考注釋質(zhì)量分級等步驟對初步矯正結(jié)果進行質(zhì)控,最終獲得兩物種的高質(zhì)量矯正注釋,并且實現(xiàn)對間隔的填補。
論文第一作者、華南農(nóng)業(yè)大學(xué)園藝學(xué)院博士研究生吳鋒琦表示,通過多個植物、動物物種組合的測試與統(tǒng)計,明確SynGAP可以對被測試基因組基因結(jié)構(gòu)注釋進行優(yōu)化——增加優(yōu)質(zhì)新基因注釋以及共線性基因?qū)?,同時提高了BUSCO完整度。
除了基因結(jié)構(gòu)注釋矯正功能模塊外,SynGAP還包含了一套物種間比較轉(zhuǎn)錄組分析流程。通過該流程可實現(xiàn)近緣物種間的準(zhǔn)確基因配對,并結(jié)合轉(zhuǎn)錄組數(shù)據(jù)完成跨物種時序性轉(zhuǎn)錄組分析,高效地篩選鑒定候選關(guān)鍵差異表達基因。其中,設(shè)計了EVI這一基因差異表達指標(biāo),可同時體現(xiàn)物種間對應(yīng)基因的表達水平差異、表達量倍數(shù)差異以及表達模式變化差異。基因?qū)Φ腅VI值越高,兩個同源基因的差異表達就越顯著。經(jīng)測試,EVI可以作為鑒定控制特定性狀或發(fā)育過程(如花色素苷合成、辣椒素合成、內(nèi)果皮木質(zhì)化和大腦體積增大)的候選關(guān)鍵基因的有效指標(biāo)。
論文共同通訊作者夏瑞表示,SynGAP基于近緣物種基因共線性,去鑒定并矯正原始基因結(jié)構(gòu)注釋中的潛在錯漏,實現(xiàn)了基因結(jié)構(gòu)注釋的優(yōu)化;并為更精準(zhǔn)的比較基因組和比較轉(zhuǎn)錄數(shù)據(jù)分析提供了新策略。
相關(guān)論文信息:https://doi.org/10.1186/s13059-024-03359-8
來源:中國科學(xué)報


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。