AI在藥物發(fā)現中的崛起:希望與挑戰(zhàn)
藥物開發(fā)中的低成功率可能令人望而生畏,但隨著人工智能開始聚焦于最有前景的候選藥物,這個問題可能會變得不那么嚴重了。
當Insilico Medicine(英矽智能)的首席執(zhí)行官Alex Zhavoronkov博士及其合著者在2023年撰寫了關于AI驅動的目標發(fā)現的觀點文章時,他們思考的是目標發(fā)現經常被誤解的情況。根據他們的經驗,大多數大型制藥或生物技術公司已經有了選擇治療目標的方法,并且在某些情況下,他們已經知道應該追求哪些目標。他們在目標發(fā)現解決方案中尋求的是確認和支持。
△Alex Zhavoronkov博士
據GEN雜志報道,Alex Zhavoronkov博士表示,像選擇投資股票一樣,制藥公司希望確保他們追求的目標是正確的。他們還需要知道何時行動起來。如果行動太早,沒有人會購買;如果行動太晚,其他人都會有相應的藥物。因此,需要保持平衡。
考慮到將藥物從發(fā)現階段經過臨床試驗并獲得監(jiān)管批準所需的巨大投資,以及90%的藥物在臨床試驗中失敗的常見統(tǒng)計數據,這種立場是可以理解的。大型制藥公司可能有足夠的資源去冒險選擇全新的目標,但對于規(guī)模較小的公司來說,如果他們選擇的候選藥物失敗,將會面臨更大的風險。
01希望的崛起
鑒于藥物研發(fā)的挑戰(zhàn),制藥公司合理地選擇投資于他們相信能夠提高成功率或降低成本的解決方案。DeepMind的AlphaFold蛋白質結構預測軟件以及OpenAI的ChatGPT等生成式AI工具的成功,增加了科學家對AI作為下一個重大藥物發(fā)現技術的興趣和信心。
在當今的科學會議上,AI成為了熱門話題。Cresset Biomolecular Discovery的首席技術官Timothy Cheeseright博士在波士頓舉行的今年的Bio-IT World Conference期間的一次對話中告訴記者,大型語言模型等某些形式的AI可以幫助藥物化學家和生物學家更高效地工作。事實上,Cresset公司正在努力將生成式AI整合到其藥物設計解決方案的產品組合中,并最近從微軟聘請了應用大型語言模型的專家Mutlu Dogruel博士來推動其戰(zhàn)略。
毫無疑問,當前對AI興趣的推動因素之一是生物醫(yī)學研究數據集的多樣性和規(guī)模。作為一名神經科學家,Jonathan Witztum博士對大數據問題非常了解。他現在擔任總部位于韓國南部并在紐約設有辦事處的AI藥物發(fā)現公司Syntekabio美國子公司的首席技術官。但他以前在一個神經科學實驗室工作,產生了大量的大腦和行為圖像和視頻,這迅速超過了常規(guī)分析技術的能力。他說,科學界“非常擅長收集大量的數據。”他補充說,AI技術是“處理大量數據的一種非常快速且一致的方法”。
在AI的幫助下,發(fā)現藥物的潛力也變得更加可觀。使用AI驅動的藥物發(fā)現公司,如BenevolentAI、Insilico Medicine和Recursion Pharmaceuticals,已經將候選藥物帶入臨床試驗階段,盡管這些候選藥物能否獲得批準還有待觀察。最近的一項分析發(fā)現,截至2023年12月,“24種AI發(fā)現的分子已經完成了一期臨床試驗,其中22種成功率達到80-90%。同樣的分析還發(fā)現,截至去年底,AI發(fā)現的10種分子已經完成了二期臨床試驗,成功率為40%。這些數據表明,AI在藥物發(fā)現方面具有巨大的潛力。

02揮之不去的疑慮
然而,AI是否能夠實現預期的效果仍然是一個未知數。許多科學家認為,在藥物發(fā)現領域,需要謹慎宣傳AI的好處,并找出哪些技術對藥物發(fā)現最有效。雖然AI已經成為一種不可或缺的存在,并在某些應用領域表現出良好的效果,但仍然需要進一步的研究和驗證。
不同形式的AI對藥物發(fā)現的影響程度是不同的。雖然科學家多年來一直在使用機器學習等AI的分支進行藥物發(fā)現,但應用深度神經網絡等技術需要大量的數據,而這些數據在臨床前研究中并不存在。
此外,AI模型并非神奇的存在。無論算法多么智能,它仍然是人造的,可能會出錯。因此,仍然需要進行復雜的測試和驗證實驗,以確保藥物和目標的結合符合預期,安全且具有足夠的親和力,可以轉化為新藥。純粹的計算方法是否能夠準確預測化合物的成功,仍然是一個需要進一步研究的問題。
03潛在的解決方案
曾經只在學術界和特定科學會議上討論的算法現在已經遠遠超越了這些領域。制藥公司正在大舉投資,旨在將AI整合到他們的流程中。無論是因為巧妙的重新包裝還是有意的投資,越來越多的軟件和服務公司聲稱幾乎在藥物發(fā)現的各個方面都有基于AI的解決方案。例如,目標識別的解決方案涵蓋了從機器學習到生成式AI的各種方法。通過這些解決方案,模型使用各種組學數據以及藥物-靶標相互作用信息、臨床試驗、藥代動力學預測、文本數據等進行廣泛的訓練,以捕捉基因、蛋白質、途徑和藥物之間的關系。
例如,AstraZeneca(阿斯利康)與BenevolentAI合作,為慢性腎臟病和特發(fā)性肺纖維化尋找新的靶點。還有像Atomwise這樣的公司,他們的基于AI的軟件AtomNet使用基于結構的藥物設計來尋找蛋白質靶點的新型小分子。像Insilico Medicine這樣的公司也已經將通過AI發(fā)現的臨床前候選藥物授權給制藥公司,獲得了巨額回報,Insilico Medicine的回報高達數億美元。

此外,Zhavoronkov的公司還提供一種基于AI的目標發(fā)現解決方案PandaOmics,它結合了多達60個學習模型,形成一個“模型團隊”,如Zhavoronkov所說。這些模型可以獨立工作或協(xié)同工作,繪制出蛋白質靶點的詳細圖像。他說:“關鍵是,不要只信任一種方法。你需要看很多很多方法。”
對于目標發(fā)現,PandaOmics的模型從基因表達、疾病關聯(lián)、甲基化、蛋白質組學和微小RNA數據中學習,還包括來自已發(fā)表文獻和其他資源的文本數據,以識別目標。它涵蓋的信息范圍很廣,包括500萬個組學數據樣本、300萬個資助、近400萬個專利、3000萬篇出版物以及130萬個化合物和生物制劑。它還包括一個類似于ChatGPT的大型語言模型,促進研究人員與平臺之間的對話。
對于特定的疾病或疾病,該系統(tǒng)根據目標的新穎性、對目標潛力的信心程度以及目標的商業(yè)可行性等因素對蛋白質靶點進行優(yōu)先排序。用戶還可以評估與藥物可藥性相關的信息,包括蛋白質靶點的結構、藥物結合能力以及對小分子或抗體的可及性。用戶還可以探索每個目標的支持數據類型,包括每個實驗數據集中包含的樣本數量、先前研究中使用的平臺以及與目標相關的任何試驗數據。甚至可以查看在生成數據集中投資了多少資金以及復制類似研究所需的成本。

Insilico Medicine于兩年前推出了PandaOmics。自那時以來,該平臺已經被數千名用戶嘗試過。Insilico繼續(xù)尋找擴展PandaOmics功能的方法。Zhavoronkov表示,其中一些擴展計劃是通過與學術界的互動而產生的。事實上,PandaOmics在一定程度上受到了Open Targets的啟發(fā),Open Targets是一個由學術界和制藥合作伙伴組成的聯(lián)盟,開發(fā)了一個基于AI的開放平臺,用于識別和優(yōu)先選擇藥物靶點。Zhavoronkov指出:“如果社區(qū)提出了想法,并且我們認為其中一種方法很有趣,我們會在獲得必要許可的情況下將其添加到平臺上。”
在藥物發(fā)現的后續(xù)階段,還有一些公司,如Syntekabio,專注于尋找和測試適用于臨床開發(fā)的可行候選藥物。當該公司于2009年成立時,計劃為新生兒提供罕見突變檢測服務。但后來,它轉向了藥物發(fā)現市場,并對AI的潛力抱有很大的期望。值得注意的是,運行基于AI的算法所需的計算能力并不是微不足道的。Syntekabio通過建立一個計算中心進行了大量的基礎設施投資,目前擁有約5000臺服務器,并計劃在不久的將來將其擴展到10000臺服務器。Syntekabio計劃到2026年建立至少兩個類似的中心,這意味著它將擁有總共30000臺服務器來支持其計算需求。
雖然AI在藥物研發(fā)領域的應用前景廣闊,但科學家們仍然需要謹慎對待,并找出最適合藥物發(fā)現的技術。AI的發(fā)展仍處于起步階段,需要進一步的研究和驗證。然而,隨著數據集的不斷增大和技術的不斷進步,AI有望在藥物研發(fā)中發(fā)揮越來越重要的作用,加速新藥的發(fā)現和開發(fā)過程。
編輯|王洪
排版:李麗
參考資料:Pun FW、Ozerov IV、Zhavoronkov A。人工智能驅動的治療靶點發(fā)現。Trends Pharmacol. Sci。2023;44(9):561–572。DOI:10.1016/j.tips.2023.06.010。
Jayatunga MKP、Ayers M、Bruens L 等人。AI 發(fā)現的藥物在臨床試驗中有多成功?初步分析和新經驗。藥物發(fā)現。今日2024;29(6):104009。DOI:10.1016/j.drudis.2024.104009。


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經許可,禁止轉載。