“阿爾法折疊2”實現(xiàn)開源 將助力發(fā)更強大的蛋白質(zhì)結(jié)構(gòu)預測技術(shù)
它代表著科學家將廣泛使用能精確測定蛋白質(zhì)3D形狀的軟件。7月16日,總部位于英國倫敦的DeepMind公司發(fā)布了其深度學習神經(jīng)網(wǎng)絡AlphaFold 2的開源版本,并在《自然》雜志的一篇論文中描述了其方法。
理解蛋白質(zhì)的結(jié)構(gòu)有助于確定蛋白質(zhì)的功能,了解各種突變的作用。截至目前,約有10萬個蛋白質(zhì)的結(jié)構(gòu)已經(jīng)用實驗方法得到了解析,但這在已經(jīng)測序的數(shù)10億計的蛋白質(zhì)中只占了很小一部分。在50多年的時間里,研究人員一直嘗試根據(jù)蛋白質(zhì)的氨基酸序列預測其折疊而成的三維結(jié)構(gòu)。然而,當前使用的計算方法準確度有限,實驗方法對人力和時間的要求也非常高。
英國,倫敦深度思維(DeepMind)公司的John Jumper、Demis Hassabis和同事描述了AlphaFold2,這是一個基于神經(jīng)網(wǎng)絡的新模型,其預測的蛋白質(zhì)結(jié)構(gòu)能達到原子水平的準確度,作者稱該方法達到了“前所未有的準確度”。
去年5至7月,Jumper等在舉辦在第14屆“蛋白質(zhì)結(jié)構(gòu)預測關鍵評估”(CASP14)大賽中驗證了這種方法。該比賽要求參賽團隊根據(jù)蛋白質(zhì)的氨基酸序列解析它們的結(jié)構(gòu)。比賽用的蛋白質(zhì)會先用實驗方法解析出來,但具體結(jié)果不會公開。
比賽中,AlphaFold2預測的大部分結(jié)構(gòu)達到了空前的準確度,不僅與實驗方法不相上下,還遠超解析新蛋白質(zhì)結(jié)構(gòu)的其他方法。將實驗方法得到的蛋白質(zhì)結(jié)構(gòu)疊加在AlphaFold2的結(jié)構(gòu)上,組成蛋白質(zhì)主鏈骨架的疊加原子之間的距離中位數(shù)(95%的覆蓋率)為0.96埃(0.096納米)。成績排第二的方法只能達到2.8埃的準確度。
AlphaFold2的神經(jīng)網(wǎng)絡能在幾分鐘內(nèi)預測出一個典型蛋白質(zhì)的結(jié)構(gòu),還能預測較大蛋白質(zhì)(比如一個含有2180個氨基酸、無同源結(jié)構(gòu)的蛋白質(zhì))的結(jié)構(gòu)。該模型能根據(jù)每個氨基酸對其預測可靠性進行精確預估,方便研究人員使用其預測結(jié)果。
作者認為,這一精準的預測算法可以讓蛋白質(zhì)結(jié)構(gòu)解析技術(shù)跟上基因組革命的發(fā)展步伐。
DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis表示,去年該公司在CASP14大會上揭曉了將蛋白質(zhì)3D結(jié)構(gòu)預測精確到原子水平的全新AlphaFold系統(tǒng)后,承諾將分享其方法,為科學共同體提供廣泛、免費的獲取途徑。
“今天我們邁出了承諾的第一步?!盚assabis說,“我們期待看到它會啟發(fā)出什么樣的其他新方法,也期待很快能和大家分享更多我們的新進展。”
機器學習軟件預測的人類白細胞介素-12蛋白與其受體結(jié)合的結(jié)構(gòu)。圖片來源:Ian Haydon,華盛頓大學蛋白質(zhì)設計醫(yī)學研究所
相關文章鏈接:
https://doi.org/10.1038/s41586-021-03819-2
來源:中國科學報


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。