哥倫比亞大學(xué)研發(fā)精準(zhǔn)預(yù)測(cè)人類細(xì)胞基因活動(dòng)的AI系統(tǒng)
近日,哥倫比亞大學(xué)巴吉洛斯醫(yī)學(xué)院的研究人員在Raul Rabadan博士的帶領(lǐng)下,開發(fā)了一種新的人工智能(AI)系統(tǒng),可以高精度地預(yù)測(cè)人類細(xì)胞中的基因活動(dòng)。這一研究成果有助于更深入地探討和理解健康細(xì)胞與病變細(xì)胞的內(nèi)部機(jī)制。相關(guān)研究成果已發(fā)表于《自然》期刊,題為《跨人類細(xì)胞類型的轉(zhuǎn)錄基礎(chǔ)模型》。
Rabadan博士表示:“預(yù)測(cè)性且具普適性的計(jì)算模型可以幫助我們快速、準(zhǔn)確地揭示生物學(xué)過程。這些方法能夠高效地進(jìn)行大規(guī)模的計(jì)算實(shí)驗(yàn),推動(dòng)并指導(dǎo)傳統(tǒng)實(shí)驗(yàn)方法的進(jìn)展?!边@項(xiàng)新開發(fā)的AI模型彌補(bǔ)了目前細(xì)胞生物學(xué)研究中存在的空白。傳統(tǒng)的研究方法通常是回顧性的——分析已經(jīng)發(fā)生或當(dāng)前正在細(xì)胞內(nèi)發(fā)生的過程。大多數(shù)實(shí)驗(yàn)都涉及逐步改變條件,評(píng)估細(xì)胞對(duì)這些條件的反應(yīng),但這些方法無法精確預(yù)測(cè)可能發(fā)生的多種變化。
Rabadan及其團(tuán)隊(duì)的AI模型從“回顧性”轉(zhuǎn)向了“前瞻性”,他們的目標(biāo)是能夠準(zhǔn)確預(yù)測(cè)細(xì)胞的活動(dòng),而這將徹底改變我們對(duì)基本生物過程的理解。他們認(rèn)為,這項(xiàng)技術(shù)的影響將使生物學(xué)從一個(gè)描述看似隨機(jī)過程的科學(xué),轉(zhuǎn)變?yōu)橐粋€(gè)可以預(yù)測(cè)支配細(xì)胞行為的系統(tǒng)的科學(xué)。
盡管他們的研究最初旨在應(yīng)用于正常細(xì)胞,但Rabadan團(tuán)隊(duì)意識(shí)到,現(xiàn)有的大多數(shù)AI模型都專注于特定類型的細(xì)胞或疾病。“過去的模型大多是針對(duì)某些特定的細(xì)胞類型,通常是癌細(xì)胞系,或者是與正常細(xì)胞差別較大的細(xì)胞,”Rabadan表示。因此,哥倫比亞大學(xué)的研究團(tuán)隊(duì)開發(fā)了名為GET(通用表達(dá)變換器)的AI模型,以揭示213種人類胎兒和成人細(xì)胞類型中的調(diào)控語(yǔ)法。GET利用染色質(zhì)可及性數(shù)據(jù)和基因組序列,從數(shù)百萬(wàn)個(gè)來自正常人體組織的細(xì)胞中預(yù)測(cè)基因表達(dá)模式。這使得GET能夠?qū)W習(xí)細(xì)胞的一般功能,為正?;虿∽兗?xì)胞的預(yù)測(cè)提供基礎(chǔ)。
GET模型的工作原理與語(yǔ)言模型(如ChatGPT)類似。Rabadan解釋道:“它的原理和語(yǔ)言模型是一樣的:我們學(xué)習(xí)多種不同細(xì)胞狀態(tài)下的語(yǔ)法規(guī)則,然后進(jìn)入特定的細(xì)胞狀態(tài)——無論是正常細(xì)胞還是病變細(xì)胞——看我們能在多大程度上預(yù)測(cè)這些模式?!蓖ㄟ^這種方式,GET能夠在不同的細(xì)胞類型和實(shí)驗(yàn)條件下揭示普遍性和細(xì)胞特異性的轉(zhuǎn)錄因子互作網(wǎng)絡(luò)。
GET模型不僅在健康細(xì)胞中具有潛力,還在病變細(xì)胞中得到了驗(yàn)證。例如,團(tuán)隊(duì)通過應(yīng)用于兒科白血病的研究,利用GET預(yù)測(cè)了轉(zhuǎn)錄因子在淋巴細(xì)胞中的相互作用突變,從而解釋了導(dǎo)致白血病風(fēng)險(xiǎn)的遺傳突變的功能意義。這一預(yù)測(cè)結(jié)果經(jīng)過實(shí)驗(yàn)室驗(yàn)證,證明了GET模型的有效性。
此外,GET模型還能夠擴(kuò)展到非編碼基因組區(qū)域的探索研究,這些區(qū)域通常涉及基因的調(diào)控功能。Rabadan指出:“癌癥患者中發(fā)現(xiàn)的大多數(shù)突變發(fā)生在基因組的‘黑暗區(qū)域’。這些突變不會(huì)影響蛋白質(zhì)的功能,通常未被深入研究?!彼J(rèn)為,通過這些模型,我們可以研究這些突變,并揭示這一部分基因組的功能。
GET模型的成功使得我們能夠更準(zhǔn)確地預(yù)測(cè)細(xì)胞在健康和病變狀態(tài)下的功能,這為疾病研究和實(shí)驗(yàn)開辟了新的方向,并可能加速我們對(duì)復(fù)雜疾病的理解。Rabadan展望,隨著AI技術(shù)的持續(xù)進(jìn)步,這類模型將為未來的生物學(xué)研究帶來更加廣闊的應(yīng)用前景。
他說:“這真的是生物學(xué)的新紀(jì)元,充滿了無限的可能性;它將把生物學(xué)轉(zhuǎn)變?yōu)橐婚T具有預(yù)測(cè)能力的科學(xué)。”
參考文獻(xiàn):https://www.nature.com/articles/s41586-024-08391-z
編輯:王洪
排版:李麗


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。