北京時間2021年4月13日,結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心薛毅課題組在《核酸研究》Nucleic Acids Research)雜志在線發(fā)表了題為《環(huán)結(jié)構(gòu)元件的特征性化學(xué)探測數(shù)據(jù)模式及其對RNA二級結(jié)構(gòu)預(yù)測準確度的改善》Characteristic chemical probing patterns of loop motifs improve prediction accuracy of RNA secondary structures)的研究長文,報道了一個整合了特征性化學(xué)探測數(shù)據(jù)的RNA二級結(jié)構(gòu)預(yù)測新方法。該方法在預(yù)測的準確度上高于傳統(tǒng)的偽自由能預(yù)測模型以及“采樣-選擇”模型。此外,該方法也可以幫助鑒定假結(jié)結(jié)構(gòu)以及RNA二級結(jié)構(gòu)的動態(tài)變化。
RNA分子通過錯綜復(fù)雜的堿基配對模式折疊成二級結(jié)構(gòu),這些二級結(jié)構(gòu)是RNA行使催化、配體結(jié)合和支架等功能的基礎(chǔ)。準確地測定RNA的二級結(jié)構(gòu)對于理解其生物學(xué)功能以及調(diào)控機制至關(guān)重要。近年來,化學(xué)小分子探針被廣泛應(yīng)用于RNA二級結(jié)構(gòu)的探測,其中,selective 2′-hydroxyl acylation analyzed by primer extension(SHAPE)技術(shù)利用親電試劑對不同狀態(tài)堿基(配對或未配對)的修飾活性的差異來實現(xiàn)對RNA二級結(jié)構(gòu)的探測。在SHAPE數(shù)據(jù)的分析中,如何合理地將SHAPE數(shù)據(jù)整合進結(jié)構(gòu)預(yù)測算法是一個關(guān)鍵的問題。常用的工具,如RNAstructure,通常將SHAPE值轉(zhuǎn)化成每個配對核苷酸各自的偽自由能約束,進而整合進熱力學(xué)預(yù)測模型中預(yù)測出最終的結(jié)構(gòu)。這類整合方法雖然顯著地提升了RNA二級結(jié)構(gòu)預(yù)測的準確度,但提升程度仍不能滿足研究者的需求,尤其是對長RNA的結(jié)構(gòu)預(yù)測和對結(jié)構(gòu)動態(tài)變化的捕捉。

鑒于使用各種不同偽自由能參數(shù)的預(yù)測方法在準確度上已經(jīng)遇到了“瓶頸”,在本項研究中,薛毅課題組從新的角度出發(fā),建立起SHAPE數(shù)據(jù)特征和環(huán)結(jié)構(gòu)元件信息之間的直接聯(lián)系。通過統(tǒng)計分析,他們發(fā)現(xiàn)對于同一類型(發(fā)卡環(huán)、內(nèi)環(huán)和凸環(huán))和長度的環(huán)結(jié)構(gòu)元件而言,其通常具有某種特征性的SHAPE模式,即在某些核苷酸位置之間存在保守的SHAPE值高低趨勢。通過對環(huán)元件的三級結(jié)構(gòu)分析,他們發(fā)現(xiàn)特征性SHAPE模式可以反映出核苷酸對糖環(huán)構(gòu)象的偏好性。為了利用這種特征性SHAPE模式來提升RNA二級結(jié)構(gòu)預(yù)測的準確度,他們提出了SHAPELoop方法。該方法通過“評估-替換”的策略對傳統(tǒng)能量模型預(yù)測出的結(jié)構(gòu)(稱為“指導(dǎo)結(jié)構(gòu)”)進行改進,以達到SHAPELoop預(yù)測出的結(jié)構(gòu)比指導(dǎo)結(jié)構(gòu)更加符合特征性SHAPE模式的目的(圖1)。

結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心薛毅課題組利用SHAPE數(shù)據(jù)特征提高了RNA二級結(jié)構(gòu)預(yù)測的準確度-肽度TIMEDOO
圖1. SHAPELoop方法框架
利用上述策略,SHAPELoop可以準確地識別出“指導(dǎo)結(jié)構(gòu)”中被錯誤預(yù)測的環(huán)元件,并對其進行替換。SHAPELoop在預(yù)測的準確度上高于傳統(tǒng)的偽自由能預(yù)測模型(RNAstructure-Fold,RNAstructure-MaxExpect和RME)以及“采樣-選擇”模型(SeqFold)(圖2)。此外,SHAPELoop對不同的“指導(dǎo)結(jié)構(gòu)”以及SHAPE數(shù)據(jù)中的噪聲也具有較好的魯棒性。
結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心薛毅課題組利用SHAPE數(shù)據(jù)特征提高了RNA二級結(jié)構(gòu)預(yù)測的準確度-肽度TIMEDOO
圖2. A) SHAPELoop及其他五種預(yù)測方法在標準RNA測試集上的表現(xiàn);B) SHAPELoop使用不同“指導(dǎo)結(jié)構(gòu)”的表現(xiàn);C) SHAPELoop對數(shù)據(jù)噪聲的魯棒性。
最后,薛毅課題組還展示了特征性SHAPE模式在幫助鑒定假結(jié)結(jié)構(gòu)以及RNA二級結(jié)構(gòu)動態(tài)變化方面的應(yīng)用。例如圖3中展示的P5abc RNA,他們利用SHAPELoop方法定量地評估了P5c亞結(jié)構(gòu)域的可能的環(huán)結(jié)構(gòu)與特征性SHAPE模式之間的符合程度,并準確地預(yù)測出了不同折疊條件下該RNA的真實二級結(jié)構(gòu)。
結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心薛毅課題組利用SHAPE數(shù)據(jù)特征提高了RNA二級結(jié)構(gòu)預(yù)測的準確度-肽度TIMEDOO
圖3 A) P5abc在沒有Mg2+的折疊條件下的結(jié)構(gòu)及SHAPELoop罰分;B) P5abc在有Mg2+的折疊條件下的結(jié)構(gòu)及SHAPELoop罰分;C) U30C突變體結(jié)構(gòu)及SHAPELoop罰分;D) G39A突變體結(jié)構(gòu)及SHAPELoop罰分。
結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心薛毅研究員為本文通訊作者,薛毅課題組生命學(xué)院博士生曹靜怡為本文第一作者。本研究得到了北京市結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心和清華-北大生命科學(xué)聯(lián)合中心的經(jīng)費支持。

原文鏈接

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkab250/6225227

來源:結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心