轉(zhuǎn)錄因子(TFs)作為基因表達(dá)的“指揮家”,通過(guò)與雙鏈DNA(dsDNA)上的特定序列-轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS)結(jié)合,來(lái)調(diào)控基因的轉(zhuǎn)錄。傳統(tǒng)TF與dsDNA的結(jié)合序列的確定實(shí)驗(yàn)是由DNA酶切的“足跡”(Foot-printing)法獲得。借助“足跡”法,科學(xué)家發(fā)現(xiàn)了很多不同DNA結(jié)合序列,即Motifs。隨著基因組學(xué)的發(fā)展,成千上萬(wàn)個(gè)TFs已被確定出來(lái)。如何高效、準(zhǔn)確地識(shí)別和刻畫(huà)TF的TFBS,特別是理解這些不同的TFs是如何快速靶向其特異結(jié)合位點(diǎn),一直是分子生物學(xué)家探索的難題之一??茖W(xué)家相繼開(kāi)發(fā)了ChIP-seq方法及其多種現(xiàn)代版本、SELEX及其HT-SELEX(high-throughput systematic evolution of ligands by exponential enrichment)方法和PBM(protein binding microarray),以及MITOMI等單分子實(shí)驗(yàn)進(jìn)行體內(nèi)和體外實(shí)驗(yàn)來(lái)探索該問(wèn)題。在計(jì)算方面,通常采用位置權(quán)重矩陣(PWM)來(lái)描述和計(jì)算TFBS Motif的特征,但PWM方法假設(shè)堿基間相互獨(dú)立,得到Motif(通常長(zhǎng)度在810bp)受實(shí)驗(yàn)方法和序列比對(duì)的影響并不一致,且該方法只能從序列的角度總結(jié)TF的特異性結(jié)合規(guī)律,無(wú)法從物理機(jī)制角度來(lái)解釋TF如何高效識(shí)別并結(jié)合到目標(biāo)位點(diǎn)。近年來(lái)的研究還表明,TF在基因組中的搜索過(guò)程可能受到TFBS周圍重復(fù)簡(jiǎn)并序列的引導(dǎo)?;蚪M中普遍存在的短串聯(lián)重復(fù)序列(STRs;26個(gè)堿基對(duì)的串聯(lián)重復(fù))在轉(zhuǎn)錄調(diào)控中也發(fā)揮著重要作用。然而,這些DNA結(jié)合方式的具體機(jī)制細(xì)節(jié)仍不清晰,也很難用傳統(tǒng)的Motif概念來(lái)解釋。

北京大學(xué)生命科學(xué)學(xué)院蘇曉東課題組揭示短序列錨定元件AE在DNA與蛋白質(zhì)結(jié)合中的重要作用-肽度TIMEDOO

原文截圖

2025年3月26日,生命科學(xué)學(xué)院/生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)蘇曉東課題組在Advanced Science上在線發(fā)表了題為“DNA–Protein Binding is Dominated by Short Anchoring Elements”的研究論文。該研究揭示了TF與DNA結(jié)合時(shí)短序列(3—4個(gè)堿基對(duì))起到主導(dǎo)作用,并將該短序列命名為錨定元件(Anchoring Elements, AEs)。論文還指出AE的密度(AED)能夠吸引相應(yīng)TF并促進(jìn)其進(jìn)一步搜索并結(jié)合到其TFBS上。

研究團(tuán)隊(duì)此前已經(jīng)基于二代深度測(cè)序技術(shù)(NGS)開(kāi)發(fā)了一種全面測(cè)量熱平衡態(tài)下TF與所有可能的DNA序列的結(jié)合能力的實(shí)驗(yàn)方法KaScape(Chen, H., Xu, Y., Jin, J. et al. Sci Rep 13, 16595 (2023))。本研究進(jìn)一步以擬南芥WRKY1和人類PU.1等轉(zhuǎn)錄因子為模型,利用KaScape方法系統(tǒng)分析了TF與DNA的結(jié)合特性。研究發(fā)現(xiàn),結(jié)合能力較強(qiáng)的序列中均含有一段共有的3—4個(gè)堿基對(duì)的短序列且只要含有該短序列,其結(jié)合能力均較強(qiáng),這說(shuō)明該短序列在TF與DNA的結(jié)合中起決定性作用。由此,本研究將該短序列命名為AE。擬南芥WRKY1的AE為GAC/GTC(GAC和GTC為反向互補(bǔ)序列),而人類PU.1的AEs為GGAA/TTCC(GGAA和TTCC為反向互補(bǔ)序列)。為了進(jìn)一步驗(yàn)證AEs的作用,研究團(tuán)隊(duì)開(kāi)發(fā)了AEEscape算法。該算法能夠計(jì)算隨機(jī)序列區(qū)域每個(gè)位置的k-mer結(jié)合能量,將PWM從1-mer拓展到了k-mer。該算法發(fā)現(xiàn),以WRKY為例,當(dāng)短序列長(zhǎng)度為2時(shí),各個(gè)位置的2-mer結(jié)合能全景圖不一致;當(dāng)短序列長(zhǎng)度為3時(shí),各個(gè)位置的結(jié)合能全景圖類似,GAC或者GTC在隨機(jī)區(qū)域的各個(gè)位置的結(jié)合能力均最強(qiáng);當(dāng)短序列長(zhǎng)度為4時(shí),隨機(jī)區(qū)域各個(gè)位置的結(jié)合能力最強(qiáng)的那些4-mer序列均含有GAC或者GTC。以上分析說(shuō)明了AE是TF與DNA結(jié)合時(shí)的最核心、最基本的元件。本研究隨后使用AEEscape算法得到的k-mer能量全景圖預(yù)測(cè)了基因組中TFBS區(qū)域的能量譜,發(fā)現(xiàn)在TFBS區(qū)域存在“能量漏斗”現(xiàn)象,該現(xiàn)象的存在說(shuō)明TFBS周圍的序列能夠幫助TF快速搜索到其目標(biāo)位點(diǎn)。進(jìn)一步研究發(fā)現(xiàn),該現(xiàn)象與TFBS附近AE的密度有關(guān)。

北京大學(xué)生命科學(xué)學(xué)院蘇曉東課題組揭示短序列錨定元件AE在DNA與蛋白質(zhì)結(jié)合中的重要作用-肽度TIMEDOO

圖1 WRKY1 N端DNA結(jié)合結(jié)構(gòu)域(WRKY1N)與DNA的復(fù)合物結(jié)構(gòu)(6j4e.pdb)。WRKY1N覆蓋的區(qū)域(Foot-printing or Motif region)用藍(lán)色雙箭頭標(biāo)出,結(jié)合時(shí)起主導(dǎo)作用的短DNA序列Anchoring Element(AE)對(duì)應(yīng)的堿基由藍(lán)框標(biāo)注。兩條DNA鏈分別標(biāo)注為Watson strand和Crick strand。對(duì)WRKY1N來(lái)說(shuō),其主要與Crick strand上的GTC(AE)相互作用

為了探究AE的廣泛存在性,本研究還進(jìn)一步分析了公共數(shù)據(jù)庫(kù)中相應(yīng)TF的PBM數(shù)據(jù)。結(jié)果發(fā)現(xiàn)了非常有趣的相似現(xiàn)象,驗(yàn)證了AE的廣泛存在性。本研究中鑒定的AEs與DNA-蛋白質(zhì)復(fù)合物結(jié)構(gòu)研究中描述的“核心序列”很好對(duì)應(yīng)(圖1),復(fù)合物結(jié)構(gòu)可以解釋結(jié)構(gòu)的穩(wěn)定性及相互作用的細(xì)節(jié),但是目前的計(jì)算方法還無(wú)法很好地得到結(jié)合能,因而不能確切鑒定到最小相互作用單元必要的核心序列。這些核心序列代表了參與靜電、氫鍵、范德瓦爾斯等相互作用的關(guān)鍵堿基。這些相互作用對(duì)DNA與TF結(jié)合的熱力學(xué)穩(wěn)定性和“特異性”至關(guān)重要,只要這些“核心”堿基存在于實(shí)驗(yàn)的序列中,KaScape方法即可以將其拉下來(lái)(pull-down),因此,與本研究中的AEs類似,這些“核心序列”較短,一般遠(yuǎn)小于Motif長(zhǎng)度。綜上所述,AE可以被視為負(fù)責(zé)TF結(jié)合的最小結(jié)構(gòu)(序列)單元,也表明構(gòu)成AE的短k-mer序列與TF相互作用時(shí),應(yīng)被視為一個(gè)整體,而不是獨(dú)立的堿基。由于僅從復(fù)合物結(jié)構(gòu)無(wú)法準(zhǔn)確計(jì)算出結(jié)合能,基于結(jié)構(gòu)來(lái)定義“核心序列”具有一定的主觀性和隨意性,而KaScape實(shí)驗(yàn)的pull-down富集結(jié)果客觀地得到了這些“核心序列”在DNA結(jié)合機(jī)制中起關(guān)鍵作用的客觀而重要的結(jié)論。

這項(xiàng)研究不僅為TF與DNA結(jié)合的分子機(jī)制提供了全新的視角,還為基因表達(dá)的調(diào)控研究開(kāi)辟了新的方向,為未來(lái)設(shè)計(jì)基因調(diào)控工具和開(kāi)發(fā)基因治療策略提供了重要的理論基礎(chǔ)。陳紅博士為論文的第一作者,蘇曉東為該論文的通訊作者。研究團(tuán)隊(duì)未來(lái)將進(jìn)一步探索AEs在更復(fù)雜生物系統(tǒng)中的作用,例如在染色質(zhì)環(huán)境下TF與核小體DNA的相互作用,以及多TF協(xié)同調(diào)控基因表達(dá)的機(jī)制。這些研究將有助于更深入地理解基因調(diào)控的復(fù)雜性,并為生物信息學(xué)、精準(zhǔn)醫(yī)學(xué)和合成生物學(xué)提供新的工具和方法。

來(lái)源:北京大學(xué)