近期,生物醫(yī)藥大模型公司「水木分子」累計已完成近億元人民幣融資。其中,天使輪由華山資本領(lǐng)投,道彤投資、訊飛創(chuàng)投參與投資;清智資本參與種子輪融資。募集資金將主要用于生物醫(yī)藥多模態(tài)大模型,以及對話式藥物研發(fā)助手工具ChatDD產(chǎn)品的研發(fā)。

水木分子由清華大學智能產(chǎn)業(yè)院(AIR)于2023年孵化成立,主要從事生物醫(yī)藥行業(yè)基礎(chǔ)大模型研究,并開發(fā)了對話式藥物研發(fā)助手工具ChatDD。清華大學國強教授、AIR首席研究員聶再清擔任公司首席科學家。

清華大學智能產(chǎn)業(yè)研究院院長張亞勤院士表示,AI+生命健康是AIR的核心研究方向之一,已取得系列研究進展,包括蛋白質(zhì)結(jié)構(gòu)精準預測、AI抗體設計、AI分子設計等。在此基礎(chǔ)上,AIR與水木分子的產(chǎn)學研合作將形成更好助力和協(xié)同。

在聶再清看來,人機協(xié)作式的藥物開發(fā)助手是未來藥品研發(fā)的必然趨勢。過去數(shù)年間,AI技術(shù)的應用雖然在藥物發(fā)現(xiàn)和優(yōu)化設計上展現(xiàn)出一定的潛力,但也面臨訓練數(shù)據(jù)不足、處理模態(tài)單一、信息和知識分離等問題?!斑@一階段的AI制藥誤區(qū)在于,過分倚重AI的作用,希望算法直接生成出候選分子或藥物。但制藥過程中,專家的經(jīng)驗和直覺往往是不可替代的,所以最好的方式其實是將二者結(jié)合起來?!?/p>

而多模態(tài)大模型是最有可能實現(xiàn)這一目標的方式,因為相較于傳統(tǒng)的AI制藥,大模型新增了一個將自然語言和生物編碼語言“對齊”的環(huán)節(jié)??梢岳斫鉃?,每一個蛋白、分子都是相互存在關(guān)聯(lián)性的知識點,而模型在尋找到知識點間的聯(lián)系的同時,還能將藥物研究人員的經(jīng)驗通過文字提問的方式融合進去,不斷“雙向激發(fā)人和大模型的思考”,從而尋找到更優(yōu)解。

在這一目標之下,水木分子首先開發(fā)了千億參數(shù)的生物醫(yī)藥多模態(tài)大模型GhatDD-FM100B。據(jù)介紹,在通用語言模型的基礎(chǔ)上,GhatDD-FM100B還疊加了生物醫(yī)藥專業(yè)知識增強、多模態(tài)對齊,以及指令微調(diào)和RLHF三層設計,確保其能夠“真正理解醫(yī)藥行業(yè)”。2023年,該模型進行了C-Eval評測,并在醫(yī)師資格、基礎(chǔ)醫(yī)學等4項測評中取得超過90分的成績。

此外,在相關(guān)算法技術(shù)創(chuàng)新方面,水木分子還開發(fā)了LangCell單細胞與文本跨模態(tài)大模型、分子與文本的跨模態(tài)大模型MV-Mol,以及原子級蛋白質(zhì)表示學習模型ESM-AA等;2023年,公司相繼開源了輕量科研版BioMedGPT-1.6B和BioMedGPT-10B,主要供科研人員學習使用。

目前,基于GhatDD-FM100B底座等現(xiàn)有技術(shù),公司已推出面向醫(yī)藥產(chǎn)業(yè)界的產(chǎn)品級應用:對話式藥物研發(fā)助手ChatDD(Chat Drug Discovery & Design),通過融合理解多模態(tài)數(shù)據(jù),與專家進行交互式的人機協(xié)作,探索藥物研發(fā)新模式。

「水木分子」獲近億元天使輪次融資,專注生物醫(yī)藥大模型開發(fā)-肽度TIMEDOO

對話式藥物研發(fā)助手ChatDD(示意)

具體到應用上,ChatDD當前聚焦于藥物立項、臨床前研究和臨床試驗助手三大場景。以進展較快的藥物立項場景為例,這是藥物研發(fā)、BD的重要起點,但立項報告的撰寫往往需要大量且繁瑣的信息收集、整理,如靶點市場競爭情況、專利布局。與此同時,由于立項工作難以外包,信息搜集難度也隨之提升。

在這一點上,ChatDD的參與能夠在一定程度上提高立項效率和質(zhì)量。目前,公司與復星醫(yī)藥的合作就主要圍繞輔助立項決策來進行,重點關(guān)注自動情報分析和商業(yè)價值評估等場景。“客戶內(nèi)部反饋不錯”,聶再清透露稱。

另據(jù)介紹,臨床前研究場景上,大模型解決的主要是新靶點、新治療方案的發(fā)現(xiàn)問題。比如,水木分子已與中醫(yī)藥創(chuàng)新企業(yè)博奧晶方達成合作,探索中醫(yī)藥領(lǐng)域疾病與不同靶點、信號通路間的關(guān)系。

而臨床試驗則是藥物研發(fā)中花費最多、風險最大的環(huán)節(jié),也是傳統(tǒng)AI技術(shù)始終未能攻克的難點。對此,大模型的數(shù)據(jù)分析能力或許能在提高臨床試驗成功概率上發(fā)揮作用,比如輔助尋找更合適的入組患者。聶再清坦言,這是“非常有意思的場景,正在投入比較大的努力做這件事”,公司已經(jīng)在和相關(guān)臨床專家、CRO公司開展合作,不過仍處在相對早期的階段。

“從市場的反饋中,我感覺無論是傳統(tǒng)藥企還是Biotech,都對利用大模型參與藥物開發(fā)具備興趣,也有一定的付費意愿,我們的訂單合作比較符合預期。大模型注定是未來的發(fā)展趨勢,我相信,生物醫(yī)藥領(lǐng)域的ChatGPT時刻很快會到來?!甭櫾偾灞硎尽?/p>

投資人觀點:

華山資本創(chuàng)始合伙人及管理合伙人楊鐳表示:水木分子團隊跨生物醫(yī)藥與人工智能大模型兩大科研領(lǐng)域,擁有多位業(yè)界頂尖科研專家,并招募了資深產(chǎn)業(yè)專家加盟,同時人才儲備還在擴充。水木分子的ChatDD對話式生物醫(yī)藥研發(fā)助手的發(fā)展方向切合未來十年的生物醫(yī)藥產(chǎn)業(yè)的需求。未來,ChatDD預計在制藥前、中、后階段發(fā)揮作用,助力商業(yè)智能與立項、臨床前藥物發(fā)現(xiàn)、臨床試驗等各環(huán)節(jié),具有極強的產(chǎn)品競爭力。

道彤投資創(chuàng)始管理合伙人孫琦表示:?ChatDD第四代藥物研發(fā)范式突破了AIDD,CADD和TMDD的局限,將人類專家知識與大模型知識聯(lián)結(jié),重新定義了藥物研發(fā)的模式,為實現(xiàn)高效、精準的藥物研發(fā)提供了新的可能性。我們對水木分子的未來發(fā)展充滿信心,也十分期待水木分子團隊繼續(xù)將先進算法應用于蛋白質(zhì)、DNA、單細胞等生物模態(tài)數(shù)據(jù)的編碼解讀,長遠助力人類進一步打開數(shù)據(jù)驅(qū)動生命科學發(fā)現(xiàn)的大門。

訊飛創(chuàng)投董事長徐景明表示:訊飛創(chuàng)投始終秉持產(chǎn)業(yè)生態(tài)投資的理念,在水木分子的投資上,我們看到了雙方在大模型領(lǐng)域的良好協(xié)同。水木分子團隊的ChatDD產(chǎn)品,是在文本通用大模型的基礎(chǔ)上開發(fā)的專注于醫(yī)藥研發(fā)輔助領(lǐng)域的多模態(tài)垂類大模型。醫(yī)藥研發(fā)過程中涉及大量專業(yè)的研究分析、文檔編寫等工作,有機會被專業(yè)大模型加速,水木分子基于其在醫(yī)藥領(lǐng)域的專業(yè)性和AI技術(shù)能力,有希望在行業(yè)內(nèi)率先實現(xiàn)對醫(yī)藥研發(fā)領(lǐng)域的人力成本節(jié)省和研發(fā)效率提升。

清智資本及清智孵化器負責人張煜表示:我們一直看好水木分子的定位,并長期持續(xù)關(guān)注其發(fā)展。水木分子已經(jīng)在相關(guān)技術(shù)創(chuàng)新、數(shù)據(jù)積累與產(chǎn)品研發(fā)、市場開發(fā)上取得了優(yōu)勢、并在關(guān)鍵維度建立行業(yè)壁壘。

來源:36kr