近期,中國(guó)科學(xué)技術(shù)大學(xué)教授劉海燕、副教授陳泉團(tuán)隊(duì)采用數(shù)據(jù)驅(qū)動(dòng)策略,提出一條全新的蛋白質(zhì)從頭設(shè)計(jì)路線,相關(guān)成果以“用于蛋白質(zhì)設(shè)計(jì)的以主鏈為中心的神經(jīng)網(wǎng)絡(luò)能量函數(shù)”為題發(fā)表于Nature。

蛋白質(zhì)是生命功能的主要執(zhí)行者,其結(jié)構(gòu)與功能由氨基酸序列所決定。目前,能夠形成穩(wěn)定三維結(jié)構(gòu)的蛋白質(zhì)幾乎全部是天然蛋白質(zhì),其氨基酸序列是長(zhǎng)期自然進(jìn)化形成。在天然蛋白結(jié)構(gòu)功能不能滿足工業(yè)或醫(yī)療應(yīng)用需求時(shí),想要得到特定的功能蛋白,就需對(duì)其結(jié)構(gòu)和序列進(jìn)行設(shè)計(jì)。目前,國(guó)際上報(bào)道的蛋白質(zhì)從頭設(shè)計(jì)工作主要使用天然結(jié)構(gòu)片段作為構(gòu)建模塊來(lái)拼接產(chǎn)生人工結(jié)構(gòu)。然而這種方法存在設(shè)計(jì)結(jié)果單一、對(duì)主鏈結(jié)構(gòu)細(xì)節(jié)過(guò)于敏感等不足,限制了設(shè)計(jì)主鏈結(jié)構(gòu)的多樣性和可變性。蛋白質(zhì)從頭設(shè)計(jì)中最困難的問(wèn)題是如何充分地探索蛋白質(zhì)主鏈結(jié)構(gòu)空間,發(fā)現(xiàn)新穎的、“高可設(shè)計(jì)性”主鏈結(jié)構(gòu),目前還缺乏相關(guān)的系統(tǒng)性解決方法。

中國(guó)科大相關(guān)團(tuán)隊(duì)長(zhǎng)期深耕計(jì)算結(jié)構(gòu)生物學(xué)方向的基礎(chǔ)研究和應(yīng)用基礎(chǔ)研究。劉海燕、陳泉團(tuán)隊(duì)十余年來(lái)致力于發(fā)展數(shù)據(jù)驅(qū)動(dòng)的蛋白質(zhì)設(shè)計(jì)方法,經(jīng)過(guò)長(zhǎng)期不懈努力,建立并實(shí)驗(yàn)驗(yàn)證了給定主鏈結(jié)構(gòu)設(shè)計(jì)氨基酸序列的ABACUS模型,進(jìn)而發(fā)展了能在氨基酸序列待定時(shí)從頭設(shè)計(jì)全新主鏈結(jié)構(gòu)的SCUBA模型。SCUBA采用一種新的統(tǒng)計(jì)學(xué)習(xí)策略,基于核密度估計(jì)(或近鄰計(jì)數(shù),NC)和神經(jīng)網(wǎng)絡(luò)擬合(NN)方法,從原始結(jié)構(gòu)數(shù)據(jù)中得到神經(jīng)網(wǎng)絡(luò)形式的解析能量函數(shù),能夠高保真地反應(yīng)實(shí)際蛋白質(zhì)結(jié)構(gòu)中不同結(jié)構(gòu)變量間的高維相關(guān)關(guān)系,在不確定序列的前提下,連續(xù)、廣泛地搜索主鏈結(jié)構(gòu)空間,自動(dòng)產(chǎn)生“高可設(shè)計(jì)性”主鏈。

理論計(jì)算和實(shí)驗(yàn)證明,用SCUBA設(shè)計(jì)主鏈結(jié)構(gòu),能夠突破只能用天然片段來(lái)拼接產(chǎn)生新主鏈結(jié)構(gòu)的限制,顯著擴(kuò)展從頭設(shè)計(jì)蛋白的結(jié)構(gòu)多樣性,進(jìn)而設(shè)計(jì)出不同于已知天然蛋白的新穎結(jié)構(gòu)?!癝CUBA模型+ABACUS模型”構(gòu)成了能夠從頭設(shè)計(jì)具有全新結(jié)構(gòu)和序列的人工蛋白完整工具鏈,是RosettaDesign之外目前唯一經(jīng)充分實(shí)驗(yàn)驗(yàn)證的蛋白質(zhì)從頭設(shè)計(jì)方法,并與之互為補(bǔ)充。在該研究中,團(tuán)隊(duì)展示了9種從頭設(shè)計(jì)的蛋白質(zhì)分子的高分辨晶體結(jié)構(gòu),它們的實(shí)際結(jié)構(gòu)與設(shè)計(jì)模型一致,其中5種蛋白質(zhì)具有天然蛋白質(zhì)中尚未觀察到的新型拓?fù)浣Y(jié)構(gòu)。

Nature審稿人認(rèn)為,“與現(xiàn)有方法不同,現(xiàn)有方法要么使用參數(shù)方程來(lái)描述預(yù)定義螺旋結(jié)構(gòu)的空間,要么基于片段組裝的方法依賴于已知蛋白質(zhì)片段。SCUBA方法原則上允許人們探索任意主鏈結(jié)構(gòu),然后填充序列,允許人們?cè)O(shè)計(jì)比自然界中觀察到的更廣泛的蛋白質(zhì)幾何結(jié)構(gòu)”,“蛋白質(zhì)從頭設(shè)計(jì)仍然具有挑戰(zhàn)性,本工作中六種不同蛋白質(zhì)的高分辨率設(shè)計(jì)是一項(xiàng)重要成就,表明此方法工作良好”,“本研究中報(bào)道的成功設(shè)計(jì)數(shù)量之多令人印象深刻,并提供了強(qiáng)有力的證據(jù),證明了基礎(chǔ)技術(shù)是魯棒的。所采用的基于神經(jīng)網(wǎng)絡(luò)的能量項(xiàng)是新穎的,因?yàn)樗鼈兛坍?huà)了更傳統(tǒng)的統(tǒng)計(jì)方法無(wú)法企及的多維特征,該方法具有足夠的新穎性和實(shí)用性”。

該研究為工業(yè)酶、生物材料、生物醫(yī)藥蛋白等功能蛋白的設(shè)計(jì)奠定了基礎(chǔ)。研究工作得到科技部、國(guó)家自然科學(xué)基金委和中科院的資助支持。

論文鏈接

?

中國(guó)科大建立新的蛋白質(zhì)從頭設(shè)計(jì)方法-肽度TIMEDOO

  用SCUBA模型進(jìn)行蛋白質(zhì)設(shè)計(jì)的原理。a:SCUBA主鏈能量面上的極小對(duì)應(yīng)了蛋白質(zhì)的可設(shè)計(jì)主鏈結(jié)構(gòu),即特定氨基酸序列下的最低自由能結(jié)構(gòu);b:SCUBA中用神經(jīng)網(wǎng)絡(luò)表示的統(tǒng)計(jì)能量項(xiàng);c、d:用近鄰計(jì)數(shù)(NC)-神經(jīng)網(wǎng)絡(luò)(NN)方法從蛋白質(zhì)結(jié)構(gòu)原始數(shù)據(jù)中學(xué)習(xí)解析能量函數(shù)的方法框架

中國(guó)科大建立新的蛋白質(zhì)從頭設(shè)計(jì)方法-肽度TIMEDOO

從頭設(shè)計(jì)蛋白的高分辨晶體結(jié)構(gòu)(天藍(lán)色)與設(shè)計(jì)模型(綠色)比較

來(lái)源: 中國(guó)科學(xué)技術(shù)大學(xué)