Journal Club 凝聚了一批熱愛(ài)科學(xué)、享受科學(xué)、傳播科學(xué)的探索者和發(fā)現(xiàn)者。他們志同道合,他們青春飛揚(yáng),他們與科學(xué)共舞。在這里,你可以收獲最新、最真的行業(yè)資訊和來(lái)自科研一線的文獻(xiàn)解讀。你關(guān)心的就是我們要說(shuō)的,我們將用最質(zhì)樸、最客觀的文字書寫有深度、有溫度的科學(xué)。Journal Club,與你暢游Journal世界,和你共享科學(xué)蔚藍(lán)。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 1 Nature 論文截圖
2023年2月22日,美國(guó)華盛頓大學(xué)的David Baker研究組在Nature發(fā)表題為“De novo design of luciferases using deep learning” 的研究工作(圖1)。Baker團(tuán)隊(duì)將此前他們?cè)诘鞍踪|(zhì)設(shè)計(jì)領(lǐng)域開(kāi)發(fā)的多種方法進(jìn)行融合,使用基于深度學(xué)習(xí)的 “family-wide hallucination” 方法從頭設(shè)計(jì)出能特異性催化底物的熒光素酶LuxSit。這項(xiàng)工作從頭創(chuàng)建了具有高活性和特異性的生物酶催化劑,是計(jì)算酶設(shè)計(jì)的一項(xiàng)重要里程碑。
熒光素酶(Luciferase)是一種常見(jiàn)的生物發(fā)光酶,無(wú)需激發(fā)光,它能催化熒光素(Luciferin)在存在氧氣的條件下發(fā)光(圖2)。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 2 熒光素酶催化熒光素氧化發(fā)光
熒光素酶催化熒光素發(fā)光的原理被廣泛應(yīng)用于生物醫(yī)學(xué)各個(gè)領(lǐng)域,特別是用于生物標(biāo)記、高通量篩選和生物成像等應(yīng)用中。而現(xiàn)在,熒光素酶的設(shè)計(jì)改造發(fā)展還存在一些困難: 已被鑒定的天然熒光素酶種類很少,識(shí)別底物的特異性不高,天然熒光素酶也不會(huì)識(shí)別具有更理想的光物理性質(zhì)的合成熒光素,一些熒光素酶需要多個(gè)二硫鍵來(lái)穩(wěn)定其結(jié)構(gòu),因此在哺乳動(dòng)物細(xì)胞中表達(dá)時(shí)容易發(fā)生錯(cuò)誤折疊。因此,表達(dá)更穩(wěn)定、底物識(shí)別特異性更高的熒光素酶成為了研究發(fā)展的需要。而基于深度學(xué)習(xí)的蛋白質(zhì)從頭合成設(shè)計(jì)賦予了這項(xiàng)研究嶄新的可能。

在這項(xiàng)研究中,研究者以人工合成熒光素DTZ(diphenylterazine)作為研究的催化底物(圖3),因?yàn)樗哂懈吡孔赢a(chǎn)率、紅移發(fā)射、有利的體內(nèi)藥代動(dòng)力學(xué)以及發(fā)光無(wú)需輔因子等特點(diǎn)。

Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 3 Diphenylterazine (DTZ) 是一種生物發(fā)光劑。Diphenylterazine 本身僅產(chǎn)生很少的背景,導(dǎo)致極好的信噪比
從頭設(shè)計(jì)酶需要將底物的結(jié)合口袋和催化底物的活性位點(diǎn)同時(shí)納入蛋白骨架。首先是對(duì)蛋白骨架的結(jié)構(gòu)設(shè)計(jì)。研究人員將DTZ與4000個(gè)天然小分子結(jié)合蛋白進(jìn)行對(duì)接。他們發(fā)現(xiàn)nuclear transport factor?2(NTF2)蛋白骨架的折疊結(jié)構(gòu)和DTZ具有良好的形狀互補(bǔ)性,因此選擇NTF2蛋白家族的骨架結(jié)構(gòu)對(duì)DTZ的結(jié)合口袋做進(jìn)一步的優(yōu)化設(shè)計(jì)。

此前,David Baker組曾報(bào)道了一系列從序列-結(jié)構(gòu)關(guān)系出發(fā)的蛋白質(zhì)設(shè)計(jì)相關(guān)算法(圖4)?!癏allucination”方法指在序列空間中進(jìn)行采樣,使用神經(jīng)網(wǎng)絡(luò)來(lái)優(yōu)化,從而產(chǎn)生有意義結(jié)構(gòu)的序列,這項(xiàng)方法保證了序列的多樣性;“Rosetta sequence-design approaches” 則是從目標(biāo)結(jié)構(gòu)出發(fā),生成符合該結(jié)構(gòu)的氨基酸序列,從而保證了結(jié)構(gòu)的特異性;而trRosetta用來(lái)做結(jié)構(gòu)預(yù)測(cè)。

Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 4 David Baker團(tuán)隊(duì)此前報(bào)道相關(guān)算法
研究者融合使用上述三種方法,即 “family-wide hallucination”,從2000個(gè)天然NTF2的序列開(kāi)始,歷經(jīng)搜索、幻想與生成,獲得了1615個(gè)符合要求的骨架序列(圖5)。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 5 熒光素酶骨架結(jié)構(gòu)的幻想設(shè)計(jì)
在蛋白骨架結(jié)構(gòu)基礎(chǔ)上,研究者們繼續(xù)對(duì)催化底物的活性中心進(jìn)行設(shè)計(jì)。此前的實(shí)驗(yàn)數(shù)據(jù)表明,DTZ在負(fù)離子狀態(tài)下具有最佳的反應(yīng)活性,因此在骨架結(jié)構(gòu)上保留了一個(gè)固定的精氨酸以維持底物的負(fù)離子狀態(tài)。在對(duì)活性中心的設(shè)計(jì)上,研究者結(jié)合他們此前開(kāi)發(fā)的RifGen方法,來(lái)模擬底物周圍最佳的氨基酸結(jié)構(gòu)組合。將活性中心的設(shè)計(jì)結(jié)構(gòu)與之前獲得的蛋白骨架對(duì)接,再通過(guò)引入疏水相互作用和氫鍵網(wǎng)絡(luò)來(lái)做進(jìn)一步的篩選,從50000個(gè)對(duì)接組合中最終篩選出7648個(gè)候選結(jié)構(gòu)(圖6)。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 6 熒光素酶活性中心的設(shè)計(jì)
利用熒光素酶篩選系統(tǒng)(圖7),研究者們表達(dá)了上述7648個(gè)候選蛋白,在實(shí)驗(yàn)中發(fā)現(xiàn)有3個(gè)成功顯示熒光素酶催化活性的蛋白酶,其中有一個(gè)活性最高的,它們將其命名為L(zhǎng)uxSit (取lux sit拉丁語(yǔ)中l(wèi)et light exist之義)。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 7 熒光素酶篩選系統(tǒng)
隨后研究者將LuxSit蛋白表達(dá)純化,并對(duì)其生物物理性質(zhì)進(jìn)行鑒定(圖8)。實(shí)驗(yàn)結(jié)果表明,LuxSit包含117個(gè)氨基酸,分子量約為13.9 kDa, 比已知的所有天然熒光素酶的分子量都小。trRosetta和Alphafold2對(duì)LuxSit的預(yù)測(cè)結(jié)構(gòu)基本一致,在體外實(shí)驗(yàn)中它也能成功催化底物DTZ發(fā)光。至此研究者們已經(jīng)實(shí)現(xiàn)了對(duì)人工熒光素酶的從頭合成。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 8 LuxSit的生物物理性質(zhì)鑒定
在LuxSit的經(jīng)驗(yàn)基礎(chǔ)上,研究者們又針對(duì)另一種熒光素底物設(shè)計(jì)了酶催化劑,也成功的實(shí)現(xiàn)了底物發(fā)光的反應(yīng);并對(duì)LuxSit設(shè)計(jì)了一些突變位點(diǎn),以期獲得更高的催化活性,在實(shí)驗(yàn)驗(yàn)證中也取得了明顯的改善(圖9)。
Nature | 新的開(kāi)始:基于深度學(xué)習(xí)從頭設(shè)計(jì)合成人工熒光素酶-肽度TIMEDOO
圖 9 Luxsit的優(yōu)化設(shè)計(jì)
綜上,本文介紹了一種基于深度學(xué)習(xí)的“family-wide hallucination”方法,該方法生成大量理想化的蛋白質(zhì)結(jié)構(gòu),其中包含多種口袋形狀和編碼它們的設(shè)計(jì)序列。使用這些蛋白骨架成功設(shè)計(jì)了人工熒光素酶,這些酶具有很高的底物選擇特異性。這是從頭合成生物酶的一次成功實(shí)踐,這一經(jīng)驗(yàn)有望用于其他類型蛋白酶的設(shè)計(jì)中。這是我們?cè)O(shè)計(jì)改造生物酶的一個(gè)嶄新開(kāi)始。
原文鏈接
https://www.nature.com/articles/s41586

-023-05696-3

參考文獻(xiàn)
參考文獻(xiàn)
1. Syed, A. J., , & Anderson, J. C., (2021). Applications of bioluminescence in biotechnology and beyond.?Chemical Society reviews,?50(9), 5668–5705. https://doi.org/10.1039/d0cs01492c

2. Anishchenko, I., Pellock, S. J., Chidyausiku, T. M., Ramelot, T. A., Ovchinnikov, S., Hao, J., Bafna, K., Norn, C., Kang, A., Bera, A. K., DiMaio, F., Carter, L., Chow, C. M., Montelione, G. T., & Baker, D. (2021). De novo protein design by deep network hallucination.?Nature,?600(7889), 547–552.

https://doi.org/10.1038/s41586-021-04184-w

3. Cao, L., Coventry, B., Goreshnik, I., Huang, B., Sheffler, W., Park, J. S., Jude, K. M., Markovi?, I., Kadam, R. U., Verschueren, K. H. G., Verstraete, K., Walsh, S. T. R., Bennett, N., Phal, A., Yang, A., Kozodoy, L., DeWitt, M., Picton, L., Miller, L., Strauch, E. M., … Baker, D. (2022). Design of protein-binding proteins from the target structure alone.?Nature,?605(7910), 551–560. https://doi.org/10.1038/s41586-022-04654-9

4. Norn, C., Wicky, B. I. M., Juergens, D., Liu, S., Kim, D., Tischer, D., Koepnick, B., Anishchenko, I., Foldit Players, Baker, D., & Ovchinnikov, S. (2021). Protein sequence design by conformational landscape optimization.?Proceedings of the National Academy of Sciences of the United States of America,?118(11), e2017228118.

https://doi.org/10.1073/pnas.2017228118

5. Yang, J., Anishchenko, I., Park, H., Peng, Z., Ovchinnikov, S., & Baker, D. (2020). Improved protein structure prediction using predicted interresidue orientations.?Proceedings of the National Academy of Sciences of the United States of America,?117(3), 1496–1503. https://doi.org/10.1073/pnas.1914677117

來(lái)源:北京生物結(jié)構(gòu)前沿研究中心