北京大學(xué)王初課題組與蘇曉東課題組合作發(fā)展蛋白質(zhì)金屬結(jié)合位點(diǎn)預(yù)測(cè)新方法
近日,北京大學(xué)化學(xué)與分子工程學(xué)院、北大-清華生命科學(xué)聯(lián)合中心、北京大學(xué)合成與功能生物分子中心王初教授課題組與北京大學(xué)生命科學(xué)學(xué)院、蛋白質(zhì)與植物基因研究國(guó)家重點(diǎn)實(shí)驗(yàn)室、北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心蘇曉東教授課題組合作在Nature Chemical Biology雜志上發(fā)表了題為“Co-evolution-based prediction of metal-binding sites in proteomes by machine learning”的研究文章。在該工作中,作者開發(fā)了一種名為MetalNet的計(jì)算方法,基于機(jī)器學(xué)習(xí)和蛋白質(zhì)共進(jìn)化信號(hào)分析來預(yù)測(cè)蛋白質(zhì)中的金屬結(jié)合位點(diǎn),為研究金屬蛋白質(zhì)組和金屬生物學(xué)提供了新的工具。
金屬離子具有獨(dú)特的物理和化學(xué)性質(zhì),在蛋白質(zhì)中發(fā)揮著穩(wěn)定結(jié)構(gòu)、物質(zhì)運(yùn)輸、催化反應(yīng)和信號(hào)傳導(dǎo)等重要功能。因此,對(duì)蛋白質(zhì)組中金屬結(jié)合蛋白以及具體金屬結(jié)合位點(diǎn)的鑒定有助于加深人們對(duì)蛋白質(zhì)功能的理解和認(rèn)識(shí)。最近,通過從多序列比對(duì)中計(jì)算得到殘基之間的共進(jìn)化信號(hào)并結(jié)合機(jī)器學(xué)習(xí),科學(xué)家們可以實(shí)現(xiàn)對(duì)蛋白質(zhì)結(jié)構(gòu)和蛋白-蛋白相互作用的精準(zhǔn)預(yù)測(cè)。受此啟發(fā),作者探究了共進(jìn)化信號(hào)在蛋白質(zhì)金屬結(jié)合位點(diǎn)上的分布情況,并發(fā)展了基于共進(jìn)化信號(hào)和機(jī)器學(xué)習(xí)預(yù)測(cè)蛋白質(zhì)組中金屬結(jié)合蛋白和金屬結(jié)合位點(diǎn)的計(jì)算方法。
作者以殘基對(duì)的氨基酸類型頻率矩陣作為輸入,將金屬結(jié)合的半胱氨酸、組氨酸、天冬氨酸和谷氨酸(“CHED”)共進(jìn)化殘基對(duì)作為正樣本,將非金屬結(jié)合的CHED共進(jìn)化殘基對(duì)作為負(fù)樣本,用于訓(xùn)練得到預(yù)測(cè)效果良好的機(jī)器學(xué)習(xí)模型。鑒于金屬結(jié)合位點(diǎn)通常有多個(gè)殘基與金屬離子配位,作者將機(jī)器學(xué)習(xí)模型預(yù)測(cè)的殘基對(duì)組裝成殘基網(wǎng)絡(luò),通過基于圖模型的過濾器得到一個(gè)相對(duì)完整的網(wǎng)絡(luò)簇,將預(yù)測(cè)方法的準(zhǔn)確度進(jìn)一步提升??偟膩碚f,該方法只需要將多序列比對(duì)衍生的共進(jìn)化信息作為輸入,而不依賴于任何已知的序列或結(jié)構(gòu)基序來進(jìn)行預(yù)測(cè)。
作者將該命名為MetalNet的預(yù)測(cè)方法用于對(duì)多個(gè)蛋白質(zhì)組數(shù)據(jù)集進(jìn)行預(yù)測(cè),在原核物種數(shù)據(jù)集中預(yù)測(cè)的潛在金屬結(jié)合蛋白接近一半可以被同源蛋白中的結(jié)構(gòu)直接支持或從其他蛋白質(zhì)數(shù)據(jù)庫中獲得間接支持。作者還在生化和結(jié)構(gòu)水平上驗(yàn)證了MetalNet預(yù)測(cè)得到的幾個(gè)此前未被注釋的全新金屬結(jié)合蛋白,包括一個(gè)來自大腸桿菌的蛋白citX中的鋅結(jié)合位點(diǎn)。最后,作者將MetalNet應(yīng)用于人剪接體蛋白質(zhì)組的預(yù)測(cè),可以準(zhǔn)確預(yù)測(cè)得到目前已經(jīng)解析的剪接體蛋白結(jié)構(gòu)中報(bào)道的所有已知鋅離子結(jié)合位點(diǎn),展示了MetalNet預(yù)測(cè)真核蛋白金屬結(jié)合位點(diǎn)的潛力。
王初、蘇曉東和王初課題組的劉源副研究員為該論文的共同通訊作者。北京大學(xué)化學(xué)與分子工程學(xué)院2017級(jí)博士研究生程瑤、2018屆博士畢業(yè)生王浩博、北京大學(xué)生命科學(xué)學(xué)院2022屆博士畢業(yè)生徐華和劉源為該論文的共同第一作者。王初課題組的馬斌,陳學(xué)敏、曾欣和王相賀等合作者也為該課題作出了貢獻(xiàn)。該工作得到了國(guó)家自然科學(xué)基金委、北京分子科學(xué)國(guó)家研究中心等的經(jīng)費(fèi)支持。
來源:北京大學(xué)


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。