藥物開發(fā)中的低成功率可能令人望而生畏,但隨著人工智能開始聚焦于最有前景的候選藥物,這個問題可能會變得不那么嚴(yán)重了。

當(dāng)Insilico Medicine(英矽智能)的首席執(zhí)行官Alex Zhavoronkov博士及其合著者在2023年撰寫了關(guān)于AI驅(qū)動的目標(biāo)發(fā)現(xiàn)的觀點文章時,他們思考的是目標(biāo)發(fā)現(xiàn)經(jīng)常被誤解的情況。根據(jù)他們的經(jīng)驗,大多數(shù)大型制藥或生物技術(shù)公司已經(jīng)有了選擇治療目標(biāo)的方法,并且在某些情況下,他們已經(jīng)知道應(yīng)該追求哪些目標(biāo)。他們在目標(biāo)發(fā)現(xiàn)解決方案中尋求的是確認(rèn)和支持。

AI在藥物發(fā)現(xiàn)中的崛起:希望與挑戰(zhàn)-肽度TIMEDOO

△Alex Zhavoronkov博士

據(jù)GEN雜志報道,Alex Zhavoronkov博士表示,像選擇投資股票一樣,制藥公司希望確保他們追求的目標(biāo)是正確的。他們還需要知道何時行動起來。如果行動太早,沒有人會購買;如果行動太晚,其他人都會有相應(yīng)的藥物。因此,需要保持平衡。

考慮到將藥物從發(fā)現(xiàn)階段經(jīng)過臨床試驗并獲得監(jiān)管批準(zhǔn)所需的巨大投資,以及90%的藥物在臨床試驗中失敗的常見統(tǒng)計數(shù)據(jù),這種立場是可以理解的。大型制藥公司可能有足夠的資源去冒險選擇全新的目標(biāo),但對于規(guī)模較小的公司來說,如果他們選擇的候選藥物失敗,將會面臨更大的風(fēng)險。

01希望的崛起

鑒于藥物研發(fā)的挑戰(zhàn),制藥公司合理地選擇投資于他們相信能夠提高成功率或降低成本的解決方案。DeepMind的AlphaFold蛋白質(zhì)結(jié)構(gòu)預(yù)測軟件以及OpenAI的ChatGPT等生成式AI工具的成功,增加了科學(xué)家對AI作為下一個重大藥物發(fā)現(xiàn)技術(shù)的興趣和信心。

在當(dāng)今的科學(xué)會議上,AI成為了熱門話題。Cresset Biomolecular Discovery的首席技術(shù)官Timothy Cheeseright博士在波士頓舉行的今年的Bio-IT World Conference期間的一次對話中告訴記者,大型語言模型等某些形式的AI可以幫助藥物化學(xué)家和生物學(xué)家更高效地工作。事實上,Cresset公司正在努力將生成式AI整合到其藥物設(shè)計解決方案的產(chǎn)品組合中,并最近從微軟聘請了應(yīng)用大型語言模型的專家Mutlu Dogruel博士來推動其戰(zhàn)略。

毫無疑問,當(dāng)前對AI興趣的推動因素之一是生物醫(yī)學(xué)研究數(shù)據(jù)集的多樣性和規(guī)模。作為一名神經(jīng)科學(xué)家,Jonathan Witztum博士對大數(shù)據(jù)問題非常了解。他現(xiàn)在擔(dān)任總部位于韓國南部并在紐約設(shè)有辦事處的AI藥物發(fā)現(xiàn)公司Syntekabio美國子公司的首席技術(shù)官。但他以前在一個神經(jīng)科學(xué)實驗室工作,產(chǎn)生了大量的大腦和行為圖像和視頻,這迅速超過了常規(guī)分析技術(shù)的能力。他說,科學(xué)界“非常擅長收集大量的數(shù)據(jù)?!彼a充說,AI技術(shù)是“處理大量數(shù)據(jù)的一種非??焖偾乙恢碌姆椒ā?/strong>。

在AI的幫助下,發(fā)現(xiàn)藥物的潛力也變得更加可觀。使用AI驅(qū)動的藥物發(fā)現(xiàn)公司,如BenevolentAI、Insilico Medicine和Recursion Pharmaceuticals,已經(jīng)將候選藥物帶入臨床試驗階段,盡管這些候選藥物能否獲得批準(zhǔn)還有待觀察。最近的一項分析發(fā)現(xiàn),截至2023年12月,“24種AI發(fā)現(xiàn)的分子已經(jīng)完成了一期臨床試驗,其中22種成功率達(dá)到80-90%。同樣的分析還發(fā)現(xiàn),截至去年底,AI發(fā)現(xiàn)的10種分子已經(jīng)完成了二期臨床試驗,成功率為40%。這些數(shù)據(jù)表明,AI在藥物發(fā)現(xiàn)方面具有巨大的潛力。

AI在藥物發(fā)現(xiàn)中的崛起:希望與挑戰(zhàn)-肽度TIMEDOO
△Cresset Biomolecular Discovery的計算化學(xué)解決方案和服務(wù)可以加速藥物發(fā)現(xiàn)。例如,該公司最近發(fā)布了其Flare藥物發(fā)現(xiàn)平臺的最新版本,旨在改進(jìn)配體和基于結(jié)構(gòu)的藥物設(shè)計和優(yōu)化。Flare可以與Cresset的KNIME分析平臺集成,以實現(xiàn)配體比較和研究、對接和評分實驗、三維模型構(gòu)建以及新分子設(shè)計的評分。

02揮之不去的疑慮

然而,AI是否能夠?qū)崿F(xiàn)預(yù)期的效果仍然是一個未知數(shù)。許多科學(xué)家認(rèn)為,在藥物發(fā)現(xiàn)領(lǐng)域,需要謹(jǐn)慎宣傳AI的好處,并找出哪些技術(shù)對藥物發(fā)現(xiàn)最有效。雖然AI已經(jīng)成為一種不可或缺的存在,并在某些應(yīng)用領(lǐng)域表現(xiàn)出良好的效果,但仍然需要進(jìn)一步的研究和驗證。

不同形式的AI對藥物發(fā)現(xiàn)的影響程度是不同的。雖然科學(xué)家多年來一直在使用機器學(xué)習(xí)等AI的分支進(jìn)行藥物發(fā)現(xiàn),但應(yīng)用深度神經(jīng)網(wǎng)絡(luò)等技術(shù)需要大量的數(shù)據(jù),而這些數(shù)據(jù)在臨床前研究中并不存在。

此外,AI模型并非神奇的存在。無論算法多么智能,它仍然是人造的,可能會出錯。因此,仍然需要進(jìn)行復(fù)雜的測試和驗證實驗,以確保藥物和目標(biāo)的結(jié)合符合預(yù)期,安全且具有足夠的親和力,可以轉(zhuǎn)化為新藥。純粹的計算方法是否能夠準(zhǔn)確預(yù)測化合物的成功,仍然是一個需要進(jìn)一步研究的問題。

03潛在的解決方案

曾經(jīng)只在學(xué)術(shù)界和特定科學(xué)會議上討論的算法現(xiàn)在已經(jīng)遠(yuǎn)遠(yuǎn)超越了這些領(lǐng)域。制藥公司正在大舉投資,旨在將AI整合到他們的流程中。無論是因為巧妙的重新包裝還是有意的投資,越來越多的軟件和服務(wù)公司聲稱幾乎在藥物發(fā)現(xiàn)的各個方面都有基于AI的解決方案。例如,目標(biāo)識別的解決方案涵蓋了從機器學(xué)習(xí)到生成式AI的各種方法。通過這些解決方案,模型使用各種組學(xué)數(shù)據(jù)以及藥物-靶標(biāo)相互作用信息、臨床試驗、藥代動力學(xué)預(yù)測、文本數(shù)據(jù)等進(jìn)行廣泛的訓(xùn)練,以捕捉基因、蛋白質(zhì)、途徑和藥物之間的關(guān)系。

例如,AstraZeneca(阿斯利康)與BenevolentAI合作,為慢性腎臟病和特發(fā)性肺纖維化尋找新的靶點。還有像Atomwise這樣的公司,他們的基于AI的軟件AtomNet使用基于結(jié)構(gòu)的藥物設(shè)計來尋找蛋白質(zhì)靶點的新型小分子。像Insilico Medicine這樣的公司也已經(jīng)將通過AI發(fā)現(xiàn)的臨床前候選藥物授權(quán)給制藥公司,獲得了巨額回報,Insilico Medicine的回報高達(dá)數(shù)億美元。

AI在藥物發(fā)現(xiàn)中的崛起:希望與挑戰(zhàn)-肽度TIMEDOO
△Atomwise利用人工智能進(jìn)行基于結(jié)構(gòu)的藥物設(shè)計技術(shù),旨在幫助科學(xué)家預(yù)測小分子與目標(biāo)蛋白質(zhì)的結(jié)合情況。該技術(shù)還可以減少對經(jīng)驗篩選的依賴。該公司聲稱其技術(shù)可以篩選數(shù)十億個化合物,并已經(jīng)在同源建模蛋白質(zhì)上取得了成功。

此外,Zhavoronkov的公司還提供一種基于AI的目標(biāo)發(fā)現(xiàn)解決方案PandaOmics,它結(jié)合了多達(dá)60個學(xué)習(xí)模型,形成一個“模型團隊”,如Zhavoronkov所說。這些模型可以獨立工作或協(xié)同工作,繪制出蛋白質(zhì)靶點的詳細(xì)圖像。他說:“關(guān)鍵是,不要只信任一種方法。你需要看很多很多方法?!?/p>

對于目標(biāo)發(fā)現(xiàn),PandaOmics的模型從基因表達(dá)、疾病關(guān)聯(lián)、甲基化、蛋白質(zhì)組學(xué)和微小RNA數(shù)據(jù)中學(xué)習(xí),還包括來自已發(fā)表文獻(xiàn)和其他資源的文本數(shù)據(jù),以識別目標(biāo)。它涵蓋的信息范圍很廣,包括500萬個組學(xué)數(shù)據(jù)樣本、300萬個資助、近400萬個專利、3000萬篇出版物以及130萬個化合物和生物制劑。它還包括一個類似于ChatGPT的大型語言模型,促進(jìn)研究人員與平臺之間的對話。

對于特定的疾病或疾病,該系統(tǒng)根據(jù)目標(biāo)的新穎性、對目標(biāo)潛力的信心程度以及目標(biāo)的商業(yè)可行性等因素對蛋白質(zhì)靶點進(jìn)行優(yōu)先排序。用戶還可以評估與藥物可藥性相關(guān)的信息,包括蛋白質(zhì)靶點的結(jié)構(gòu)、藥物結(jié)合能力以及對小分子或抗體的可及性。用戶還可以探索每個目標(biāo)的支持?jǐn)?shù)據(jù)類型,包括每個實驗數(shù)據(jù)集中包含的樣本數(shù)量、先前研究中使用的平臺以及與目標(biāo)相關(guān)的任何試驗數(shù)據(jù)。甚至可以查看在生成數(shù)據(jù)集中投資了多少資金以及復(fù)制類似研究所需的成本。

AI在藥物發(fā)現(xiàn)中的崛起:希望與挑戰(zhàn)-肽度TIMEDOO
△Insilico Medicine 開發(fā)了 PandaOmics,這是一個基于云的軟件平臺,將人工智能和生物信息學(xué)技術(shù)應(yīng)用于多模態(tài)組學(xué)和生物醫(yī)學(xué)文本數(shù)據(jù),以發(fā)現(xiàn)治療靶點和生物標(biāo)志物。在最近的一篇論文中,該公司的科學(xué)家介紹了幾個案例研究,驗證了 PandaOmics 的靶點識別能力(Kamya et al. J. Chem. Inf. Model. 2024;doi:10.1021/acs.jcim.3c01619)。

Insilico Medicine于兩年前推出了PandaOmics。自那時以來,該平臺已經(jīng)被數(shù)千名用戶嘗試過。Insilico繼續(xù)尋找擴展PandaOmics功能的方法。Zhavoronkov表示,其中一些擴展計劃是通過與學(xué)術(shù)界的互動而產(chǎn)生的。事實上,PandaOmics在一定程度上受到了Open Targets的啟發(fā),Open Targets是一個由學(xué)術(shù)界和制藥合作伙伴組成的聯(lián)盟,開發(fā)了一個基于AI的開放平臺,用于識別和優(yōu)先選擇藥物靶點。Zhavoronkov指出:“如果社區(qū)提出了想法,并且我們認(rèn)為其中一種方法很有趣,我們會在獲得必要許可的情況下將其添加到平臺上。”

在藥物發(fā)現(xiàn)的后續(xù)階段,還有一些公司,如Syntekabio,專注于尋找和測試適用于臨床開發(fā)的可行候選藥物。當(dāng)該公司于2009年成立時,計劃為新生兒提供罕見突變檢測服務(wù)。但后來,它轉(zhuǎn)向了藥物發(fā)現(xiàn)市場,并對AI的潛力抱有很大的期望。值得注意的是,運行基于AI的算法所需的計算能力并不是微不足道的。Syntekabio通過建立一個計算中心進(jìn)行了大量的基礎(chǔ)設(shè)施投資,目前擁有約5000臺服務(wù)器,并計劃在不久的將來將其擴展到10000臺服務(wù)器。Syntekabio計劃到2026年建立至少兩個類似的中心,這意味著它將擁有總共30000臺服務(wù)器來支持其計算需求。

雖然AI在藥物研發(fā)領(lǐng)域的應(yīng)用前景廣闊,但科學(xué)家們?nèi)匀恍枰?jǐn)慎對待,并找出最適合藥物發(fā)現(xiàn)的技術(shù)。AI的發(fā)展仍處于起步階段,需要進(jìn)一步的研究和驗證。然而,隨著數(shù)據(jù)集的不斷增大和技術(shù)的不斷進(jìn)步,AI有望在藥物研發(fā)中發(fā)揮越來越重要的作用,加速新藥的發(fā)現(xiàn)和開發(fā)過程。

編輯|王洪

排版:李麗

參考資料:Pun FW、Ozerov IV、Zhavoronkov A。人工智能驅(qū)動的治療靶點發(fā)現(xiàn)。Trends Pharmacol. Sci。2023;44(9):561–572。DOI:10.1016/j.tips.2023.06.010。

Jayatunga MKP、Ayers M、Bruens L 等人。AI 發(fā)現(xiàn)的藥物在臨床試驗中有多成功?初步分析和新經(jīng)驗。藥物發(fā)現(xiàn)。今日2024;29(6):104009。DOI:10.1016/j.drudis.2024.104009。