華人博士一作Cell發(fā)文!開發(fā)“細胞命運”預(yù)測器
如果我們能“定制”細胞,會發(fā)生什么?
當人體需要某類細胞時,比如心臟出現(xiàn)問題,就取些成纖維細胞,“定制”打造成心肌細胞來幫助心臟恢復(fù);當人體不需要某類細胞時,比如發(fā)生癌變,就引導(dǎo)癌變細胞快速凋亡。
幾位華人博士為這一設(shè)想的實現(xiàn)提供了新的工具。他們開發(fā)了一個細胞命運預(yù)測模型,能夠預(yù)測細胞發(fā)育所要經(jīng)歷的過程和最終命運。還能給出相應(yīng)的發(fā)育方程,定量描述細胞命運的轉(zhuǎn)變路徑。
也就是說,如果想定制某一類細胞,需要哪些細胞作為原材料、需要什么條件、如何選擇分化路徑,這個模型都能告訴你。
北京時間2月1日,美國麻省理工學院教授Jonathan Weissman組博士后邱肖杰、匹茲堡大學博士生張衍為共同一作的研究在Cell(《細胞》)在線發(fā)表。
張衍、邱肖杰
尋找生物學中的“萬有引力”定律
作為17世紀自然科學最偉大的成果之一,萬有引力定律揭示了天體運動的規(guī)律。在天文觀測中,只要有一定的觀測資料,根據(jù)萬有引力定律,就能計算出天體運動的軌道。這為航天探索提供了堅實的理論基礎(chǔ)。
而在微觀層面,當動物體內(nèi)的胚胎干細胞分化成心肌細胞、造血細胞、骨髓細胞、脂肪細胞等時,或許也遵循著某個定律。如果能找到這個定律,就像計算天體運動軌道一樣,也能計算出單個細胞的分化路徑。
2011年,在導(dǎo)師的“放養(yǎng)”式管理下,邱肖杰擁有大把的時間去廣泛閱讀文獻,這個過程中他萌生了上述想法。那時的他很興奮,立即選取了兩個基因的相互作用進行數(shù)學建模,對體系分化進行了初步的函數(shù)表征。
“雖然當時的研究很不成熟,也沒有發(fā)表在特別好的期刊上,但這顆種子已經(jīng)深深扎進我心里了?!鼻裥そ苷f。
后來,隨著單細胞測序技術(shù)的出現(xiàn)和發(fā)展,他意識到,這給細胞分化命運的研究帶來了契機。
決定每個細胞獨特功能的是細胞內(nèi)活躍的一大批特定基因,它們相互作用構(gòu)成了決定細胞分化命運的大型調(diào)控網(wǎng)絡(luò)。當有了所有細胞的基因組數(shù)據(jù)、有了大數(shù)據(jù)技術(shù),全面分析基因調(diào)控網(wǎng)絡(luò)也就成為了可能。
2018年,單細胞數(shù)據(jù)分析領(lǐng)域有一個重要突破,有研究者提出利用RNA速率從固定細胞數(shù)據(jù)中預(yù)測細胞基因表達狀態(tài)變化方向的方法。
這也給了邱肖杰很大的啟發(fā):我們能否再進一步,不僅實現(xiàn)細胞命運的預(yù)測,也給出相應(yīng)的“方程式”和生物學解釋呢?
邱肖杰
用物理學方法解決生物學問題
一次偶然的面試時,邱肖杰遇到了邢建華,即本篇研究的通訊作者之一、匹茲堡大學教授。
“肖杰很熱情地向我解釋他的想法,事實證明,他找對人了?!毙辖ㄈA告訴《中國科學報》,“我們課題組一直致力于用數(shù)學和物理的思維及手段解決生物學問題,尤其是認識并調(diào)控細胞形態(tài)分化或重組。用數(shù)學方程描述基因網(wǎng)絡(luò)是系統(tǒng)生物學的基本工具,其中一個挑戰(zhàn)是缺乏大規(guī)模的定量數(shù)據(jù),而這正是肖杰擅長的。我們一拍即合?!?/p>
邢建華
落實到具體的研究中,想要把細胞、基因、相互作用等生物學中的概念,抽象成數(shù)學表達,再放到動力學系統(tǒng)理論的框架下,找到能夠擬合的函數(shù),最終得出“細胞命運”方程,并不容易。
后來,邱肖杰、張衍采用機器學習的方法,對十幾個數(shù)據(jù)集進行了分析,每個數(shù)據(jù)集中包含數(shù)千至數(shù)萬個細胞不等,經(jīng)過優(yōu)化迭代,最終開發(fā)出了名為dynamo(發(fā)動機)的算法模型。
“優(yōu)化迭代中的每一步都不好走,由于沒有成型的工具包,我們需要不斷調(diào)試參數(shù)、代碼,保證擬合效果。同時,為了使這個工具好用,我們還要盡可能地減小內(nèi)存、加快運行速度?!睆堁苷f。
張衍
對于大多數(shù)的機器學習方法來說,其中的過程都是“黑箱”,即使能給出準確的預(yù)測結(jié)果,但結(jié)果是怎么得來的,很難明確解釋。
而在本項研究中,他們結(jié)合重構(gòu)的向量場與系統(tǒng)生物學/動力學系統(tǒng)理論中的一些概念,使“黑箱”變成了“白箱”。也就是說,dynamo不僅能預(yù)測細胞分化的最終命運,還能給出相應(yīng)的生物學解釋,即由于在哪些關(guān)鍵基因的在哪些分化階段的相互作用才導(dǎo)致了細胞的最終分化。
隨后的2000多個人造血干細胞分化的驗證實驗表明,將單細胞測序數(shù)據(jù)作為dynamo輸入量,即可預(yù)測出其分化成神經(jīng)細胞、紅細胞、血液細胞等的動態(tài)圖譜及分化時間。這與以往研究者利用動物實驗進行細胞分化的結(jié)果完全吻合。
學科交叉產(chǎn)生的奇妙反應(yīng)
談及研究成功的“秘笈”,幾位合作者不約而同地提到了學科交叉。
這種學科交叉不僅體現(xiàn)在合作者有著不同的學術(shù)背景,還可以追溯到他們多年前的“不務(wù)正業(yè)”。
“研究生階段,我花了很多時間閱讀文獻,從中發(fā)現(xiàn)了自己真正感興趣的方向,和我當時的方向并不一致,頂住了重重壓力才得以繼續(xù)研究?!鼻裥そ芨嬖V《中國科學報》。
而對于藥學專業(yè)背景的張衍來說,把時間花在數(shù)學、計算機的專業(yè)學習上,才是他最喜歡的事情。
邢建華更是如此?!白鳛槲锢砘瘜W背景出身的人,我希望為生物學研究注入新的視角。我想,本項研究的最大貢獻是能啟發(fā)大家利用單細胞數(shù)據(jù)和物理思維,結(jié)合數(shù)據(jù)和理論去尋找細胞動力學方程?!?/p>
視角不同,當然會有爭執(zhí),有很多次,這幾位研究者爭論得面紅耳赤,誰也不服誰。
可這恰恰也是碰撞的樂趣,化學反應(yīng)中,不同的物質(zhì)相遇,升溫、變色甚至爆炸都是常事,可只要弄清楚性質(zhì)、掌握好劑量,不同物質(zhì)間產(chǎn)生的相互作用遠比一種物質(zhì)更加奇妙。
圖文摘要
論文信息:
https://doi.org/10.1016/j.cell.2021.12.045
dynamo:
https://github.com/aristoteleo/dynamo-release
來源:科學網(wǎng)微信公號


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。