AI解碼生命語言:全球最大生物模型 Evo 2 問世,有望革新疾病治療方式
從微小的樹蛙到高聳的紅杉,再到人類自身,DNA 是驅(qū)動地球上一切生命的核心密碼。而現(xiàn)在,一種全新的人工智能模型正幫助科學(xué)家以前所未有的規(guī)模解讀這種生命語言,為生物學(xué)和醫(yī)學(xué)研究帶來革命性的突破。
今年2月,加州大學(xué)伯克利分校生物工程助理教授 Patrick Hsu 和其團(tuán)隊在預(yù)印本平臺 bioRxiv 上發(fā)布了全球最大的生物AI模型 Evo 2。這一模型由他們共同創(chuàng)辦的非營利機(jī)構(gòu) Arc Institute 開發(fā),訓(xùn)練數(shù)據(jù)量超過 9.3 萬億個核苷酸,來自包括細(xì)菌、植物、動物在內(nèi)的 10 萬個物種,涵蓋 12.8 萬個完整基因組。
Hsu 形容 Evo 2 是“生物學(xué)領(lǐng)域的 ChatGPT”——這款A(yù)I模型不僅可以分析大規(guī)模遺傳數(shù)據(jù),還能預(yù)測基因變異是否具有致病性,并輔助設(shè)計全新的治療方案。
破解未知的基因變異,提升疾病風(fēng)險預(yù)測能力
以 BRCA1 基因為例,它是與乳腺癌密切相關(guān)的重要基因。某些 BRCA1 突變已知具有致癌性(pathogenic),另一些則無害(benign),但大部分突變屬于“意義不明變異”(Variant of Unknown Significance,VUS)——醫(yī)學(xué)界尚無法判斷其風(fēng)險。
“如果你攜帶致病突變,可能需要切除乳腺;如果是良性突變,一年一次的篩查就足夠。但當(dāng)面對 VUS 時,醫(yī)生和患者都面臨決策困境,”Hsu 指出,“而 Evo 2 已經(jīng)能以90%以上的準(zhǔn)確率,判斷這些變異更可能是致病還是無害?!?/p>
AI語言模型如何解讀“生命之語”
Evo 2 的工作原理與大型語言模型如 ChatGPT 類似——但它處理的不是人類語言,而是DNA和RNA中由A、C、G、T、U五種核苷酸組成的生命語言。
“如果我給你一串核苷酸序列,比如 G, T, G, C, A, T, C……你很難預(yù)測下一個會是什么,”Hsu 解釋道,“但 AI 可以從數(shù)萬億的數(shù)據(jù)中學(xué)習(xí)出復(fù)雜的序列規(guī)律和生物學(xué)特性。”
Evo 2 可以一次性處理 多達(dá)一百萬個核苷酸,大幅提升對全基因組數(shù)據(jù)中隱藏模式的挖掘能力,這種能力使它不僅能預(yù)測疾病風(fēng)險,還能揭示疾病發(fā)生的根本機(jī)制,甚至引導(dǎo)新藥開發(fā)的方向。
從“試錯”到“智能設(shè)計”:AI能否加速臨床突破?
長期以來,生物醫(yī)學(xué)研究多依賴“假設(shè)—實驗—驗證”的試錯機(jī)制,效率低、成本高,而治療藥物的研發(fā)尤其如此:90%的臨床試驗最終以失敗告終。
“我們做了大量生物實驗,但最終可能是在研究錯誤的靶點(diǎn),”Hsu 說,“AI的價值就是讓我們從一開始就走在正確的道路上?!?/p>
Evo 2 已經(jīng)能準(zhǔn)確識別哪些RNA基因?qū)τ诩?xì)胞功能至關(guān)重要,哪些則無關(guān)緊要;它還能夠指出哪些基因調(diào)控細(xì)胞行為并可能導(dǎo)致疾病,從而幫助研究人員更早鎖定關(guān)鍵靶點(diǎn)。
Amgen全球研發(fā)高級副總裁 Howard Chang 表示:“過去mRNA從1961年被發(fā)現(xiàn),到新冠疫苗真正應(yīng)用,整整花了60年。我們不能再讓生物醫(yī)學(xué)突破等待幾十年?!?/p>
用AI對抗阿爾茨海默癥:一場科學(xué)家的私人使命
對 Hsu 來說,這不僅是科研,更是情感驅(qū)動的使命。他的祖父在他少年時期罹患阿爾茨海默癥,疾病帶來的無力感深深影響了他的人生選擇。如今,Hsu 在加州大學(xué)和 Arc Institute 繼續(xù)聚焦這類目前仍無有效療法的復(fù)雜疾病。
“你去看美國30年前的致死疾病排行榜,今天仍是那些老面孔:心臟病、癌癥、阿爾茨海默癥。我們投了越來越多的錢,研究了越來越多的課題,但真正的治愈進(jìn)展依然有限,”他說。
他希望,通過 Evo 2 這類AI工具,可以實現(xiàn)真正意義上的“個性化醫(yī)療”——將基因組數(shù)據(jù)與個人健康記錄結(jié)合,預(yù)測個體患病風(fēng)險,并制定精準(zhǔn)治療方案。
展望:一個更高效、更健康的未來
未來,Evo 2 有望成為科學(xué)家手中的“生命預(yù)言機(jī)”,幫助他們厘清基因與疾病之間復(fù)雜的因果關(guān)系,加快從“理解機(jī)制”到“開發(fā)療法”的每一步。
“我們的目標(biāo)不僅是知道某個突變是否會致病,”Hsu 總結(jié)道,“而是全面識別遺傳組合如何影響健康,并用這一信息為每個人制定最合適的醫(yī)療策略?!?/p>
參考文獻(xiàn):Garyk Brixi et al, Genome modeling and design across all domains of life with Evo 2,?bioRxiv?(2025).?DOI: 10.1101/2025.02.18.638918
編輯:王洪
排版:李麗


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。