行研 | 新藥篩選技術(shù)-那些嶄露頭角的后浪們(上)

本文作者:Nancy、Yutong、Yuhan
全球新藥研發(fā)支出已經(jīng)從2011年的1360億美元提升至2018年的1515億美元,預(yù)計(jì)2020年將達(dá)到1598億美元,CAGR(復(fù)合年均增長率)達(dá)1.6%。哈佛醫(yī)學(xué)院健康政策系Richard G·Frank教授在其發(fā)表的一篇文章中提到,全球新藥研發(fā)支出中有30%的費(fèi)用用于小分子藥物研發(fā)。據(jù)此可以估算,預(yù)計(jì)到2020年,全球小分子藥物研發(fā)市場規(guī)模將達(dá)到479億美元1。
相反,如果初始活性化合物的結(jié)構(gòu)質(zhì)量低下,例如,較差的物理性能和藥代動力學(xué),存在已知會引起問題的結(jié)構(gòu)基團(tuán),脫靶效應(yīng),較弱的體外藥效等,則需要進(jìn)行長期而復(fù)雜的多參數(shù)優(yōu)化。在競爭激烈的市場環(huán)境下,這勢必會增加研發(fā)成本,降低研發(fā)成功率2。
從文章統(tǒng)計(jì)結(jié)果中可以看到,基于已知活性化合物(Known)的研究以及高通量篩選(HTS)仍然是新藥研發(fā)的主流策略,但是DEL技術(shù)、虛擬篩選/人工智能篩藥等藥物發(fā)現(xiàn)里的后浪們也已經(jīng)嶄露頭角,占有一席之地。

圖12:2016-2017年J.Med.Chem上發(fā)表的66個(gè)臨床候選化合物發(fā)現(xiàn)策略統(tǒng)計(jì)

表1:各種藥物篩選技術(shù)的比較
(來源:奇跡之光整理)

圖23? DEL技術(shù)篩選流程
- 成本低,時(shí)間短,效率高??梢酝瑫r(shí)測試成千上萬種與結(jié)構(gòu)相關(guān)的化合物(包括立體異構(gòu)體和對映異構(gòu)體),并在每次選擇后提供“即時(shí)SAR數(shù)據(jù)庫”
- 對靶標(biāo)蛋白需求量少,通量更高6
- 非凡的靈敏度,且可以在簡單的試管中快速生成臨時(shí)的“即用型”化學(xué)文庫(成千上萬個(gè)有機(jī)小分子7)
- 不需要開發(fā)復(fù)雜的生物學(xué)測定方法
- 對儲存空間要求極小
例如,從DEL篩查中鑒定出的一種可溶性環(huán)氧化物水解酶抑制劑進(jìn)入了I期臨床試驗(yàn),成為治療心血管和呼吸系統(tǒng)疾病的潛在藥物8。同樣,一系列受體相互作用蛋白1(RIP1)激酶抑制劑也顯示出了良好的功效,藥代動力學(xué)特性將以供臨床研究進(jìn)行進(jìn)一步評估9。
目前DEL技術(shù)發(fā)展趨勢
國際和國內(nèi)諸多藥企和外包服務(wù)商均開始布局 DEL 技術(shù)
目前國際上 DEL 技術(shù)領(lǐng)域應(yīng)用較為成熟的企業(yè)有 4 家,分別是 GSK、X-Chem(美國)、HitGen(成都先導(dǎo))和 Nuevolution(丹麥)。其中 GSK 是對 DEL 技術(shù)應(yīng)用最為成熟、規(guī)模最大的企業(yè),但是 GSK 的技術(shù)僅供自用,不對外服務(wù)。目前很多國內(nèi)外公司相繼進(jìn)行DEL技術(shù)的布局。

表2:DEL 領(lǐng)域主要企業(yè)情況梳理
(來源:成都先導(dǎo)招股書,康龍化成 2018 年年報(bào),藥明康德 2019 年中報(bào),民生證券研究院)
從下圖可以看出全球DEL技術(shù)服務(wù)商對外公布合作項(xiàng)目總量逐年遞增。從已公開的合作項(xiàng)目統(tǒng)計(jì)看(2015 年至 2019 年 3 月)成都先導(dǎo)是DEL 技術(shù)領(lǐng)域研發(fā)服務(wù)公司中合作項(xiàng)目最多的企業(yè)。
圖3 全球DEL公司對外公布合作項(xiàng)目總量
(來源:成都先導(dǎo)招股書,民生證券研究院)
盡管高通量測序技術(shù)的進(jìn)步極大地促進(jìn)了DECL技術(shù)的發(fā)展,但HTS本身已成為最大的DECL庫的固有限制。由于統(tǒng)計(jì)分析對于在施加選擇條件之前和之后,測序計(jì)數(shù)與單個(gè)文庫成員的相對豐度之間的準(zhǔn)確關(guān)聯(lián)是必不可少的,所以就文庫大小而言,產(chǎn)生足夠程度的測序覆蓋至關(guān)重要。如果要使用一百萬個(gè)化合物文庫對選擇進(jìn)行解碼,則需要3到500萬個(gè)高質(zhì)量的測序讀取,并且每次測序的通量定為約5000萬個(gè)DNA序列(成本約為5.00歐元) ,尚無法以合理的成本對包含數(shù)百萬個(gè)成員化合物的DECL庫進(jìn)行準(zhǔn)確的計(jì)算。
DNA標(biāo)記的小分子的膜不透性對細(xì)胞內(nèi)DEL選擇提出了巨大挑戰(zhàn)
目前,沒有報(bào)告實(shí)現(xiàn)這一目標(biāo)。但是,在其他研究領(lǐng)域,DNA分子已通過各種化學(xué),物理和生物學(xué)技術(shù)常規(guī)地遞送到活細(xì)胞中。一些方法,例如轉(zhuǎn)染,顯微注射和使用細(xì)胞可滲透的肽,可能適合于文庫遞送。高傳遞效率將是確保細(xì)胞內(nèi)有足夠的文庫材料可用于靶標(biāo)檢測的重要因素。最后,可能還需要靶標(biāo)的過表達(dá)/標(biāo)記才能實(shí)現(xiàn)靶標(biāo)特異性10。
其中,以深度學(xué)習(xí)為代表的AI算法是藥物虛擬篩選領(lǐng)域的熱門應(yīng)用方向之一。
- 節(jié)省時(shí)間,極大縮短研發(fā)周期
- 降低篩選成本
- 先進(jìn)的算法和大數(shù)據(jù)可以有效提高篩選的準(zhǔn)確性
- 機(jī)器學(xué)習(xí)的特性有助于發(fā)現(xiàn)目標(biāo)的更多新特性
據(jù)報(bào)道,與傳統(tǒng)方法相比,人工智能可以節(jié)省40%-50%的化合物合成和篩選時(shí)間,每年為制藥公司節(jié)省260億美元的化合物篩選成本11。
使用機(jī)器學(xué)習(xí)進(jìn)行虛擬篩選,目的在于創(chuàng)建一個(gè)模型來預(yù)測一個(gè)給定的化合物是否會結(jié)合到一個(gè)給定的目標(biāo)上。與傳統(tǒng)計(jì)算機(jī)輔助藥物篩選有所區(qū)別的是,篩選模型并不是完全從“第一性原理”出發(fā),基于人工界定的物理規(guī)則(分子、原子之間的相互作用等),而是通過海量數(shù)據(jù)驅(qū)動,利用機(jī)器學(xué)習(xí)發(fā)現(xiàn)靶標(biāo)和目標(biāo)化合物之間的聯(lián)系。
模型的建立總體可分成數(shù)據(jù)集準(zhǔn)備和模型驗(yàn)證兩個(gè)步驟。其中,用于訓(xùn)練的數(shù)據(jù)集在這個(gè)過程中至關(guān)重要,用于藥物篩選的數(shù)據(jù)集通常需要是標(biāo)注了結(jié)合活性的化合物庫,包含了已知會結(jié)合的化合物和已知不會結(jié)合的化合物12。該數(shù)據(jù)集將會分成訓(xùn)練集和測試集,分別用于模型的訓(xùn)練優(yōu)化以及準(zhǔn)確性驗(yàn)證。建立一個(gè)優(yōu)質(zhì)的模型,需要在對訓(xùn)練集的準(zhǔn)確性和對未知數(shù)據(jù)的泛化能力之間取得平衡。
模型的評估基于預(yù)測的真陽性(TP)、假陽性(FP)、真陰性(TN)和假陰性(FN)等數(shù)據(jù)結(jié)果展開,利用以上數(shù)據(jù)可得出該模型的靈敏度、特異性、準(zhǔn)確性以及Matthews相關(guān)系數(shù)(MCC),此外AUC也是一項(xiàng)常用的評估標(biāo)準(zhǔn)12。對于機(jī)器學(xué)習(xí)中不同的算法,需要設(shè)定的參數(shù)也不盡相同。除了隨機(jī)設(shè)定參數(shù),其他常見的方法包括建立使用不同算法參數(shù)的多個(gè)模型,通過數(shù)據(jù)驗(yàn)證選擇其中評分最高的一項(xiàng)。
在深度學(xué)習(xí)發(fā)展以前,各種傳統(tǒng)的機(jī)器學(xué)習(xí)方法已得到普遍應(yīng)用,并成為非常有競爭力的預(yù)測手段。

圖4?人工智能、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)之間的關(guān)系示意圖

表4.?海外的幾家與AI藥物篩選相關(guān)的代表性公司
(來源:企業(yè)官網(wǎng)、動脈網(wǎng)等公開資料整理)
1)主流大藥企的藥物研發(fā)在AI方向均有布局,大多數(shù)藥企選擇與AI公司進(jìn)行合作開發(fā)
2)自2016年以來AI藥物研發(fā)領(lǐng)域的投資獲得了顯著的持續(xù)增長,但近期增速正在放緩,且投資正轉(zhuǎn)向后期階段
3)少數(shù)公司獲得了大部分資金,20%的企業(yè)獲得了近80%的投資
4)美國該領(lǐng)域的公司數(shù)量遠(yuǎn)超其他國家,成為了行業(yè)的主導(dǎo)者

表5.?國內(nèi)的部分與AI藥物篩選相關(guān)公司
(來源:企業(yè)官網(wǎng)、動脈網(wǎng)、匯眾醫(yī)療等公開資料整理)
面對藥物研發(fā)后期巨大的成本投入,藥物學(xué)家不可能完全相信某個(gè)黑盒算法給出的“武斷”預(yù)測,即僅僅通過AI找到一種潛在的化合物,因?yàn)檫@并不能保證科學(xué)家們理解疾病的生化特征。因此,人工智能藥物設(shè)計(jì)研究的重點(diǎn)之一就是需要探索深度學(xué)習(xí)算法的可解釋性,針對性地開發(fā)了更符合化學(xué)背景、更易于解讀的人工智能模型。
相較于ChEMBL等數(shù)據(jù)庫已有百萬級的數(shù)據(jù),能用作深度學(xué)習(xí)算法訓(xùn)練的優(yōu)質(zhì)數(shù)據(jù)仍然稀缺。例如基于配體與受體3D結(jié)構(gòu)進(jìn)行預(yù)測的卷積神經(jīng)網(wǎng)絡(luò)算法就需要高質(zhì)量的3D結(jié)構(gòu)數(shù)據(jù),而目前所擁有的相關(guān)數(shù)據(jù)對于訓(xùn)練出一個(gè)優(yōu)秀的模型來說依舊是不足的18。
因此,AI公司與藥企進(jìn)行合作的一大考量即是可以借助藥企的研發(fā)數(shù)據(jù)進(jìn)行模型的開發(fā)和優(yōu)化。
另一方面,在醫(yī)藥領(lǐng)域,數(shù)據(jù)往往被孤立地保存起來,或者被特定的研究小組或特定的科學(xué)家收集。他們擁有這些數(shù)據(jù),但不分享這些數(shù)據(jù),這成為了模型優(yōu)化的一大限制條件。是否能夠使得更多的人訪問這些數(shù)據(jù)或?qū)⒊蔀锳I藥物篩選發(fā)展過程中的一個(gè)關(guān)鍵因素。
2)隨著近些年逐年升高的研發(fā)失敗率,基于靶點(diǎn)的篩選策略也遇到了困境和瓶頸,主要?dú)w咎于單藥物-單靶標(biāo)-單疾病的藥物設(shè)計(jì)指導(dǎo)思想。由于靶點(diǎn)一般來自于理想模型的機(jī)理研究,所以真的回到人體環(huán)境的疾病中,這個(gè)靶點(diǎn)可能根本不相關(guān),很多報(bào)道的靶點(diǎn)無法在實(shí)驗(yàn)室中重復(fù)出來。新藥用藥后可能還會對其他靶點(diǎn)起作用,從而產(chǎn)生副作用,或療效降低。復(fù)雜疾病通常并非單分子的突變或功能障礙,而通常由整體調(diào)節(jié)網(wǎng)絡(luò)的功能障礙所引起。像NASH或者腫瘤微環(huán)境這樣多細(xì)胞多通路參與的,文獻(xiàn)報(bào)道了很多看起來極具潛力的靶點(diǎn),都在藥物開發(fā)的各個(gè)階段失敗了。
4)已驗(yàn)證的好靶點(diǎn)數(shù)量有限,造成公司間對同靶點(diǎn)的競爭非常激烈,同質(zhì)化嚴(yán)重。
5)基于表型篩選的藥物發(fā)現(xiàn)(Phenotypic drug discovery, PDD)為解決這些問題提供了可能性。這種藥物發(fā)現(xiàn)方式不依賴于對靶點(diǎn)和機(jī)理的理解。它的起點(diǎn)是一個(gè)化合物庫,用一個(gè)和疾病高度相關(guān)的臨床前模型或者實(shí)驗(yàn)來篩選庫中的藥效,找到達(dá)到期望藥效的分子再進(jìn)一步優(yōu)化和開發(fā)。同時(shí),逆推靶點(diǎn)和其作用機(jī)理。
在下篇中,我們將著重介紹基于“代謝表型”的篩選技術(shù),這種顛覆式的篩藥策略基于制備門檻極高的代謝探針,其可以動態(tài)實(shí)時(shí)監(jiān)測化合物對核心細(xì)胞代謝物的影響進(jìn)而發(fā)現(xiàn)先導(dǎo)化合物。
究竟是“前浪”更可靠有效,還是“后浪”技高一籌。下篇我們將對基于代謝表型的篩藥技術(shù)以及如何在這些“前浪”“后浪”選擇最適合的篩藥平臺做詳細(xì)討論,盡情期待!
1. 1(16). 廖慶陽. DEL技術(shù)掀起藥物研發(fā)革命熱潮[N]. 中國醫(yī)藥報(bào),2019-11-04(004).
2. Dean G. Brown and Jonas Bostr?m,Journal of Medicinal Chemistry 2018 61 (21), 9442-9468,Where Do Recent Small Molecule Clinical Development Candidates Come From?
3.Brenner S and Lerner RA (1992) Encoded combinatorial chemistry. Proc Natl Acad Sci USA 89, 5381– 5383.
4.Favalli N, Bassi G, Scheuermann J, Neri D. DNA-encoded chemical libraries – achievements and remaining challenges. FEBS Lett. 2018;592(12):2168–2180.
5.https://mp.weixin.qq.com/s/wiyg5wVlbALdwxZsJrNW-Q
6.民生證券-從 DEL 看藥物篩選平臺的商業(yè)路徑選擇
7.???http://www.decltechnology.com/remarks-outlook.html
8.Lazaar AL, Yang L, Boardley RL, et al. Pharmacokinetics, pharmacodynamics and adverse event profile of GSK2256294, a novel soluble epoxide hydrolase inhibitor. Br J Clin Pharmacol. 2016;81(5)
9.Harris PA, King BW, Bandyopadhyay D, et al. DNA-Encoded Library Screening Identifies Benzo[b][1,4]oxazepin-4-ones as Highly Potent?and Monoselective Receptor Interacting Protein 1 Kinase Inhibitors. J Med Chem. 2016;59(5):2163–2178.
10. Mayr, L. M. and Bojanic, D. (2009) Novel trends in high-throughput screening Curr. Opin. Pharmacol. 9
11. 動脈網(wǎng)-百企大戰(zhàn)AI+新藥研發(fā):全視野透視78家AI創(chuàng)新企業(yè)、26家全球制藥巨頭,https://vcbeat.top/ZTAxNWExNzIwMTI4OGMzZTkxNmQwOGRhYmJiZWFlM2Q=
12. Carpenter K A , Cohen D S , Jarrell J T , et al. Deep learning and virtual drug screening[J]. Future Medicinal Chemistry, 2018.
13. Jing Y , Bian Y , Hu Z , et al. Deep Learning for Drug Design: an Artificial Intelligence Paradigm for Drug Discovery in the Big Data Era[J]. Aaps Journal, 2018, 20(3):58.
14. Carpenter K A , Cohen D S , Jarrell J T , et al. Deep learning and virtual drug screening[J]. Future Medicinal Chemistry, 2018.
15. 9 Artificial Intelligence in Drug Discovery Trends and Statistics,https://blog.benchsci.com/artificial-intelligence-in-drug-discovery-trends-and-statistics
16. Voosen, P. (2017) The AI detectives. Science 357, 22–27
17. Nature: Hunting for New Drugs with AI,https://www.nature.com/articles/d41586-019-03846-0
18. Predicting Drug Target Interactions: Advances and Pitfalls,https://cyclicarx.com/news/predicting-drug-target-interactions


本文系作者 @華大集團(tuán) 授權(quán)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。