當(dāng)?shù)貢r(shí)間5月8日,谷歌DeepMind發(fā)布其生物學(xué)預(yù)測(cè)工具AlphaFold的最新版本——AlphaFold 3。這一重大成果在科學(xué)界引起了巨大轟動(dòng)。在蛋白質(zhì)預(yù)測(cè)領(lǐng)域?qū)<铱磥?lái),AlphaFold 3是“變革性的”和“令人印象深刻的”。他們表示,這項(xiàng)工作可以用于測(cè)序蛋白質(zhì)、DNA、RNA、小分子等幾乎所有生物分子結(jié)構(gòu)和相互作用。此次AlphaFold3的模型是DeepMind和AI制藥公司Isomorphic Labs共同開(kāi)發(fā)的,這項(xiàng)研究已發(fā)表在《自然》雜志上。但其不公開(kāi)底層代碼、僅提供受限訪問(wèn)的舉措,引發(fā)了科學(xué)界的廣泛批評(píng)。截至5月14日,已有超過(guò)650名研究人員聯(lián)名簽署公開(kāi)信,表示對(duì)論文不提供代碼感到失望,并批評(píng)期刊違背了其關(guān)于代碼可用性的規(guī)定。

?
將在6個(gè)月內(nèi)為學(xué)界提供開(kāi)源模型
AlphaFold 3目前只能通過(guò)網(wǎng)絡(luò)服務(wù)器訪問(wèn),每日請(qǐng)求限制為20次(發(fā)布之初請(qǐng)求限制是10次)。此外,用戶在分析分子方面也面臨限制。例如,它無(wú)法預(yù)測(cè)蛋白質(zhì)與新型藥物之間的相互作用,這可能是為了防止與Isomorphic Labs的競(jìng)爭(zhēng)。AlphaFold 3的代碼在《自然》雜志的論文審查過(guò)程中并未公開(kāi)。??怂共趟拱┌Y中心的計(jì)算結(jié)構(gòu)生物學(xué)家Roland Dunbrack是這封信的組織者之一,他表示在收到手稿時(shí)沒(méi)有辦法測(cè)試程序。Dunbrack說(shuō):“在與雜志社聯(lián)系后,我獲得了網(wǎng)絡(luò)服務(wù)器早期版本的訪問(wèn)權(quán)限,但在文章發(fā)表前,我曾多次要求提供代碼,但都沒(méi)有得到回應(yīng)。我不明白編輯為什么要在這種情況下把它送審?!?/section>美國(guó)加州大學(xué)舊金山分校的結(jié)構(gòu)生物學(xué)家、這封信的組織者之一James Fraser說(shuō):“這篇論文沒(méi)有提供理由,只是提出‘未提供代碼’,這似乎違反了《自然》雜志的政策。”《自然》的編輯政策規(guī)定:作者必須及時(shí)向讀者提供代碼,不得有不適當(dāng)?shù)南拗啤?/section>這一明顯的矛盾引起了研究人員的憤怒。瑞典斯德哥爾摩大學(xué)的生物物理學(xué)家、這封信的署名者Erik Lindahl說(shuō):“在我看來(lái),這項(xiàng)工作的大部分內(nèi)容都不符合科學(xué)研究的要求,實(shí)際上這是一則商業(yè)廣告?!?/section>面對(duì)批評(píng),《自然》雜志主編Magdalena Skipper發(fā)表聲明,為該雜志處理這篇論文的方式進(jìn)行了辯護(hù)。她指出,盡管《自然》力求在每個(gè)機(jī)會(huì)中提高透明度,但在某些情況下可能無(wú)法公開(kāi)研究數(shù)據(jù)或代碼。編輯們會(huì)考慮很多不同的因素,包括對(duì)生物安全的潛在影響以及由此帶來(lái)的倫理挑戰(zhàn),在這種情況下,編輯部會(huì)與作者合作提供支持可重復(fù)性的替代方案。自公開(kāi)信發(fā)布以來(lái),DeepMind研究人員已經(jīng)表示,有關(guān)AlphaFold 3的更多信息即將發(fā)布。DeepMind研究員、AlphaFold 3論文的作者之一Pushmeet Kohli發(fā)布推文,回應(yīng)學(xué)界的質(zhì)疑和不滿,宣布將在6個(gè)月內(nèi)為學(xué)界提供開(kāi)源模型。?
“AlphaFold 3測(cè)試全軍覆沒(méi)”
自AlphaFold 2于2020年發(fā)布以來(lái),科學(xué)家們已經(jīng)廣泛使用這一工具預(yù)測(cè)了各種蛋白質(zhì)結(jié)構(gòu)、發(fā)現(xiàn)了藥物以及繪制了多種已知蛋白質(zhì)。
AlphaFold 3的進(jìn)步在于它不僅可以處理蛋白質(zhì),還可以同時(shí)輸入核酸、小分子、金屬離子等物質(zhì),并預(yù)測(cè)它們會(huì)如何與蛋白質(zhì)結(jié)合。因?yàn)榈鞍踪|(zhì)不可能孤立地發(fā)揮作用,而是需要與其他物質(zhì)產(chǎn)生交流,這一過(guò)程也是科學(xué)家們最關(guān)心的。5月9日晚,中國(guó)科學(xué)院院士、深圳灣實(shí)驗(yàn)室主任顏寧在個(gè)人微博賬號(hào)發(fā)布長(zhǎng)文表示,“我對(duì)AI的態(tài)度總結(jié)起來(lái)其實(shí)是兩個(gè)字‘敬畏’,它的發(fā)展速度超乎想象。每次我都是指出AlphaFold版本當(dāng)前不能解決的問(wèn)題,比如最近我比較癡迷的glycoproteins、那些‘暗物質(zhì)’們、in situ structures(原位結(jié)構(gòu)),等等。但終歸也只是時(shí)間問(wèn)題。”她強(qiáng)調(diào):“這次的server版本我覺(jué)得是一個(gè)速度和準(zhǔn)確度的平衡,正確率不是最好的。我現(xiàn)在手上有三個(gè)比較奇怪的蛋白,之前我自己搭的AF2 multimer可以在很低的ranking position找到一兩個(gè)正確的conformation,這次的server版本測(cè)試全軍覆沒(méi)?!?/section>