近日,北京大學(xué)深圳研究生院信息工程學(xué)院AI4S平臺中心主任與化學(xué)生物學(xué)與生物技術(shù)學(xué)院合聘研究員陳語謙發(fā)表綜述文章,聚焦人工智能(AI)對傳統(tǒng)中醫(yī)藥(TCM)研究賦能這一主題,總結(jié)了過去二十幾年來世界最大的中醫(yī)藥數(shù)據(jù)庫(TCMBank)建立、維護和更新過程,并且深入探討了TCM與AI在多個研究領(lǐng)域的整合應(yīng)用,包括草藥篩選、新藥發(fā)現(xiàn)、診斷治療原則、藥理機制和網(wǎng)絡(luò)藥理學(xué)等。該綜述還詳細探討了AI通過數(shù)據(jù)挖掘、模式識別和預(yù)測分析,揭示TCM復(fù)雜配方活性成分和作用機制的過程。AI與TCM的結(jié)合不僅幫助人們從新的角度理解傳統(tǒng)的中醫(yī)藥知識,還開辟了新的研究方法和治療策略。該成果發(fā)表在2024年9月的Chemical Science,第一作者為北京大學(xué)化學(xué)生物學(xué)與生物技術(shù)學(xué)院博士生宋治霖和中山大學(xué)智能工程學(xué)院博士生陳觀興,通訊作者為陳語謙,其他相關(guān)工作還包括發(fā)表于2023年的Chemical Science和2023年的Signal Transduction and Targeted Therapy(STTT,IF=40.8)。

TCM是天然產(chǎn)物的重要來源,從1981年到2019年,超過60%的FDA批準的小分子藥物直接或間接來源于天然產(chǎn)物。此外,TCM還能根據(jù)患者的具體需求和偏好提供多種治療選擇。近年來,人工智能(AI)技術(shù)的發(fā)展為TCM研究帶來了巨大潛力。通過AI技術(shù)加速藥物發(fā)現(xiàn)、優(yōu)化配方和推動TCM現(xiàn)代化,AI技術(shù)可以確保TCM在保留傳統(tǒng)根基的同時,與最新的科學(xué)進展同步發(fā)展。目前,在中醫(yī)院里臨床治療研究中,引入AI不僅提高了診斷的準確性,還促進了個性化醫(yī)療的發(fā)展,使TCM研究更加高效和精準。

深圳研究生院陳語謙團隊發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

基于人工智能的中醫(yī)藥化學(xué)數(shù)據(jù)分析促進了化學(xué)成分的識別、藥物發(fā)現(xiàn)、個性化治療和藥理作用的闡明,推動了中醫(yī)藥的現(xiàn)代化和可持續(xù)發(fā)展

目前,中醫(yī)藥的網(wǎng)絡(luò)藥理學(xué)研究主要集中在證明中醫(yī)藥理論上,缺乏網(wǎng)絡(luò)設(shè)計和優(yōu)化原則的明確定義。合理的處方設(shè)計可分為自上而下和自下而上兩種類型。自上而下的方法基于舊處方設(shè)計新處方,而自下而上的方法則不考慮舊處方,完全基于疾病網(wǎng)絡(luò)設(shè)計新處方。陳語謙團隊結(jié)合了多種可行的方法,首先定義了幾種未來最常見的自上而下優(yōu)化模型。自上而下和自下而上的設(shè)計方法都基于計算系統(tǒng)生物學(xué)原理利用生物網(wǎng)絡(luò)建立相關(guān)性,但考慮現(xiàn)有處方和中醫(yī)理論方面存在差異,在中醫(yī)理論尚未定量表達之前,不考慮舊處方的新公式設(shè)計更可能與中醫(yī)原則相沖突。近年來,中醫(yī)逐漸向天然產(chǎn)品的分類和組織發(fā)展。在人類過度開發(fā)的背景下,許多中醫(yī)藥品種面臨滅絕,因此陳語謙團隊建立一種計算天然產(chǎn)品與中醫(yī)藥物種個體之間相關(guān)性的方法,并使用高可靠性模型快速篩選可替代、可優(yōu)化和可去除的處方成分。作者認為,新處方公式的設(shè)計必將成為一個核心研究領(lǐng)域,為中藥的可持續(xù)發(fā)展帶來重要影響。

深圳研究生院陳語謙團隊發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

中醫(yī)處方網(wǎng)絡(luò)設(shè)計與優(yōu)化方法概述

在中醫(yī)領(lǐng)域,了解草藥與常規(guī)藥物之間的相互作用對于確?;颊甙踩椭委熜Ч陵P(guān)重要。作者針對中藥與西藥相互作用的綜合臨床研究給出了一種提案。該提案設(shè)定了一個綜合臨床研究系統(tǒng),旨在全面探索這些相互作用,如下圖所示,該系統(tǒng)分為三個主要模塊:臨床研究系統(tǒng)、綜合系統(tǒng)和基礎(chǔ)研究,每個模塊關(guān)注化學(xué)分析和數(shù)據(jù)整合的不同方面,以預(yù)測和分析藥物不相容性。臨床研究系統(tǒng)主要負責(zé)收集和分析臨床數(shù)據(jù),以評估草藥與藥物組合的藥代動力學(xué)和藥效學(xué)特性。該模塊可以利用先進的化學(xué)提取方法和分析技術(shù),旨在通過嚴格的臨床測試和化學(xué)分析識別潛在的不良相互作用。同時,該模塊也可以利用數(shù)據(jù)挖掘和機器學(xué)習(xí)算法處理復(fù)雜的臨床數(shù)據(jù),識別預(yù)測藥物相互作用結(jié)果的模式。綜合方法的核心是綜合系統(tǒng),其中包含HAZA@home平臺。該系統(tǒng)可以結(jié)合臨床研究和基礎(chǔ)研究的數(shù)據(jù),為患者提供實時健康監(jiān)測和預(yù)測分析,也可以使用廣泛的數(shù)據(jù)庫網(wǎng)絡(luò)和模擬工具,個性化健康評估和藥物相互作用警示,利用人工智能根據(jù)個體患者數(shù)據(jù)調(diào)整建議。基礎(chǔ)研究系統(tǒng)模塊通過深入的化學(xué)分析和計算建模來支持綜合系統(tǒng),預(yù)測藥物靶點并模擬藥物相互作用。這包括使用中醫(yī)和臨床藥物數(shù)據(jù)庫、ADMET預(yù)測模型及創(chuàng)建小分子數(shù)據(jù)庫。這些工具對理解藥物相互作用的生化機制至關(guān)重要,有助于開發(fā)預(yù)防潛在不良反應(yīng)的策略。該提案體現(xiàn)了在中醫(yī)藥相互作用研究中臨床與基礎(chǔ)科學(xué)方法的整合。通過結(jié)合化學(xué)分析、實時數(shù)據(jù)監(jiān)測和人工智能驅(qū)動的預(yù)測建模,該系統(tǒng)不僅可以增強對復(fù)雜藥物相互作用的理解,還將開創(chuàng)中藥與藥物治療整合中患者安全的新方法,為未來的研究和應(yīng)用設(shè)定基準。相關(guān)研究成果已發(fā)表在Chem. Sci. 2024, 15 (41), 16844—16886. (https://doi.org/10.1039/D4SC04107K

深圳研究生院陳語謙團隊發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

一個全面的自動臨床研究系統(tǒng)提案

在中醫(yī)藥(TCM)的現(xiàn)代化過程中,確定草藥中的活性成分以及闡明活性成分與靶標之間的作用機制是兩個關(guān)鍵方面。構(gòu)建一個全面且高度可靠的中醫(yī)藥數(shù)據(jù)庫顯得尤為重要。自2011年建立以來,陳語謙團隊的TCM Database@Taiwan得到了廣泛使用和大量引用,并被納入ZINC數(shù)據(jù)庫。為了進一步推進中醫(yī)藥研究,作者利用自然語言處理技術(shù),建立了知識圖譜和分子信號通路,開發(fā)了TCMBank,該數(shù)據(jù)庫是TCM Database@Taiwan的升級版,包含9192種草藥、61,966種化學(xué)成分、15,179個靶標和32,529種疾病,相關(guān)研究成果已發(fā)表在Chem. Sci. 2023, 14 (39), 10684—10701. (https://doi.org/10.1039/D3SC02139D)。

深圳研究生院陳語謙團隊發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

TCMBank的數(shù)據(jù)處理框架和目標示意圖

在當(dāng)今醫(yī)療領(lǐng)域,中西藥的結(jié)合治療越來越普遍,但同時也帶來了藥物相互作用的風(fēng)險。為了更好地預(yù)測和管理中西藥之間的相互作用,減少醫(yī)療風(fēng)險,本研究利用先進的AI技術(shù)和大數(shù)據(jù)分析,開發(fā)了多個創(chuàng)新模型和數(shù)據(jù)庫,為中西藥相互作用的研究提供了強有力的支持。研究團隊發(fā)現(xiàn),超過10%的患者需要同時服用5種藥物,20%的老年患者需要同時服用至少10種藥物。這一現(xiàn)象對藥物相互作用的研究提出了新的挑戰(zhàn)?;谒幬锘瘜W(xué)知識,研究團隊認為藥物的官能團/化學(xué)子結(jié)構(gòu)決定了其藥代動力學(xué)、藥效學(xué)特性以及中西藥的互斥性。因此,他們提出了一個創(chuàng)新的算法,通過建立藥物相互作用網(wǎng)絡(luò)來預(yù)測多種藥物之間的相互作用。在這個網(wǎng)絡(luò)中,化合物作為節(jié)點,它們的因果關(guān)系作為邊。中藥中所有成分對應(yīng)的節(jié)點形成了一個子網(wǎng)絡(luò)。通過分析子網(wǎng)絡(luò)之間的連接,研究團隊可以預(yù)測中藥之間或中藥與西藥之間是否存在不良反應(yīng)。未來,AI輔助模型將結(jié)合大規(guī)模語言模型、自然語言處理和文本挖掘知識圖譜技術(shù),開發(fā)中西藥不良反應(yīng)數(shù)據(jù)庫,進一步提高預(yù)測的準確性和實用性。研究團隊在兩個現(xiàn)實世界的公共藥物相互作用(DDI)數(shù)據(jù)集上提出了兩個模型:3DGT-DDI和SA-DDI。這兩個模型在兩個公共DDI數(shù)據(jù)集上實現(xiàn)了最精確的預(yù)測性能?;谶@些模型的預(yù)測結(jié)果,研究團隊進一步推廣到中西藥不良反應(yīng)的預(yù)測中。利用TCMBank的大數(shù)據(jù)驅(qū)動,研究團隊進行了無監(jiān)督學(xué)習(xí),預(yù)測中西藥的不良反應(yīng)。假設(shè)中藥中的所有成分與西藥均不發(fā)生不良反應(yīng),則確定它們之間不存在相互排斥的反應(yīng)。如果中藥中的一種或多種成分與西藥發(fā)生不良反應(yīng),則存在可能產(chǎn)生不良反應(yīng)的風(fēng)險。研究團隊利用AI輔助的DDI預(yù)測模型獲得了中西醫(yī)可能的不良反應(yīng)風(fēng)險的預(yù)測結(jié)果,相關(guān)研究成果已發(fā)表在Signal Transduction and Targeted Therapy上(https://doi.org/10.1038/s41392-023-01339-1)。

深圳研究生院陳語謙團隊發(fā)表綜述文章,聚焦人工智能賦能中醫(yī)藥創(chuàng)新發(fā)展-肽度TIMEDOO

世界最大的智能中醫(yī)藥數(shù)據(jù)庫TCMBank的綜合分析

上述三項工作論文通訊作者為陳語謙,研究得到了國家自然科學(xué)基金面上和重點項目支持。

參考文獻

[1] Song, Z.; Chen, G.; Chen, C. Y.-C. AI Empowering Traditional Chinese Medicine? Chem. Sci. 2024,15 (41), 16844—16886.https://doi.org/10.1039/D4SC04107K.

[2] Lv, Q.; Chen, G.; He, H.; Yang, Z.; Zhao, L.; Chen, H.-Y.; Chen, C. Y.-C. TCMBank: Bridges between the Largest Herbal Medicines, Chemical Ingredients, Target Proteins, and Associated Diseases with Intelligence Text Mining. Chem. Sci. 2023, 14 (39), 10684–10701. https://doi.org/10.1039/D3SC02139D.

[3] Lv, Q.; Chen, G.; He, H.; Yang, Z.; Zhao, L.; Zhang, K.; Chen, C. Y.-C. TCMBank-the Largest TCM Database Provides Deep Learning-Based Chinese-Western Medicine Exclusion Prediction. Signal Transduct. Target. Ther. 2023, 8 (1), 127. https://doi.org/10.1038/s41392-023-01339-1.

來源:北京大學(xué)