基因組測序表明,除了少數(shù)常見的突變基因外,影響癌癥基因組的大多數(shù)突變都很罕見。為了解釋這些罕見突變,一種有力的方法是依據(jù)突變所影響的蛋白質(zhì)系統(tǒng)將他們進行劃分。以這種方式來理解癌癥基因組需要克服兩個關(guān)鍵的挑戰(zhàn):(i) 我們?nèi)绾稳胬L制癌細胞中的蛋白質(zhì)系統(tǒng)?(ii) 我們?nèi)绾未_定哪些系統(tǒng)處于突變選擇之下?近日,由加州大學(xué)舊金山分校(UCSF)和圣地亞哥分校(UCSD)主導(dǎo)的研究團隊在Science雜志上背靠背發(fā)表了三篇文章,以親和純化質(zhì)譜(AP-MS)測定了癌細胞中以關(guān)鍵癌癥蛋白為中心的蛋白質(zhì)相互作用(PPI)網(wǎng)絡(luò),并通過和現(xiàn)有的蛋白質(zhì)互作網(wǎng)絡(luò)和癌癥基因組數(shù)據(jù)整合,構(gòu)建了一個多尺度的圖譜,對癌癥中具有顯著突變的蛋白質(zhì)系統(tǒng)進行了研究。其中兩篇文章分別側(cè)重于對乳腺癌和頭頸癌細胞系中發(fā)現(xiàn)的的描述和下游生物功能分析。最后一篇文章(Zheng et al.)系統(tǒng)描述了構(gòu)建癌癥突變的圖譜的信息學(xué)方法,題為:Interpretation of cancer mutations using a multiscale map of protein systems。研究者進一步通過多種實驗手段研究圖譜中全新的蛋白質(zhì)系統(tǒng),并發(fā)現(xiàn)了之前未知的突變促致癌癥的機理。
在本文中,研究者首先整合了兩篇配套文章中的PPI和先前研究中的PPI數(shù)據(jù)以及四種其他類型的證據(jù)——包括mRNA和蛋白質(zhì)的共表達,序列相似性以及遺傳共依賴性?;诒O(jiān)督機器學(xué)習(xí),對所有證據(jù)進行定量加權(quán)和組合,以創(chuàng)建每對人類蛋白質(zhì)的綜合關(guān)聯(lián)嚴格性?(Integrated Association Stringency,?IAS)?。由于IAS分數(shù)代表了蛋白質(zhì)關(guān)聯(lián)的連續(xù)度量,在不同的IAS閾值下可從PPI網(wǎng)絡(luò)中識別出不同強度和大小的蛋白質(zhì)系統(tǒng)。通過分層社區(qū)檢測(hierarchical community detection)算法,強關(guān)聯(lián)且較小的蛋白質(zhì)復(fù)合體被包含在較大的組件中,從而形成了層次結(jié)構(gòu)。當(dāng)應(yīng)用于整個 IAS 網(wǎng)絡(luò)時,分層社區(qū)檢測總共識別出 2338 個蛋白質(zhì)系統(tǒng)。值得注意的是,當(dāng)數(shù)據(jù)支持時,該方法允許蛋白質(zhì)出現(xiàn)在不同的系統(tǒng)中。例如,β-catenin被置于不同的系統(tǒng),分別代表了其在adherens junction和β-catenin destruction complex中的功能。為確定哪些系統(tǒng)在癌癥中面臨突變的壓力,研究者開發(fā)了一個統(tǒng)計模型HiSig,以確定一組系統(tǒng),可以最佳地解釋所有基因中觀察到的突變模式,同時尋求盡量減少此類解釋所需的系統(tǒng)數(shù)量。利用TCGA的癌癥體細胞突變數(shù)據(jù),在13種常見癌癥中,HiSig分析共確定了319個在一種或多種癌癥中存在突變選擇的系統(tǒng),從而產(chǎn)生了稱為NeST(Nested Systems in Tumors)的最終圖譜。研究者對NeST的系統(tǒng)做了全面的注釋,并使用獨立的癌癥數(shù)據(jù)集進行了重復(fù)性驗證。
接下來,研究者選擇了兩個新發(fā)現(xiàn)的NeST系統(tǒng)進行實驗驗證。AP-MS數(shù)據(jù)中的PPI建立了PIK3CA和一組肌動球蛋白(myosin; 包括MYH9和MYH10)之間的新的特異性物理關(guān)聯(lián)。通過鄰近連接測定(Proximity Ligation Assay)和超分辨率顯微鏡,研究者證明了PIK3CA和MYH9在頭頸癌細胞系CAL-33中共定位。通過測量PI3K信號通路的下游標志物AKT和S6的磷酸化水平,實驗結(jié)果表明抑制myosin功能可激活PIK3CA介導(dǎo)的的信號傳導(dǎo)。
在另一個由纖維狀膠原蛋白(fibrillar collagen)組成的系統(tǒng)中,HiSig分析在多種癌癥中發(fā)現(xiàn)了這一系統(tǒng)具有顯著升高的突變頻率——這些突變在過去對顯著突變的單基因分析中往往被忽略。膠原蛋白含有富含甘氨酸和脯氨酸殘基的螺旋重復(fù)區(qū)域,這些結(jié)構(gòu)域?qū)τ谀z原蛋白正確折疊成三聚體束至關(guān)重要。研究者假設(shè)膠原蛋白的突變可能通過破壞蛋白質(zhì)折疊從而破壞細胞外基質(zhì)的結(jié)構(gòu)來促進腫瘤進展。使用成纖維細胞(fibroblast)表達正?;蛲蛔凅w的膠原蛋白基質(zhì),研究者發(fā)現(xiàn)在突變體基質(zhì)中培養(yǎng)的肺癌細胞的增殖大大增加,這些數(shù)據(jù)支持膠原蛋白突變在破壞腫瘤微環(huán)境以促進癌癥進展方面的作用。最后,研究者分析了NeST系統(tǒng)的突變和癌癥預(yù)后的關(guān)聯(lián),并使用NeST系統(tǒng)提名了一個548個基因的癌癥基因目錄。目錄中預(yù)測的新的癌基因和已知的癌癥基因具有相似的性質(zhì),而和其他的基因顯著不同。研究者們展望,相對于單基因水平的突變,系統(tǒng)水平的突變有望成為更有效的預(yù)后分析和藥物治療響應(yīng)的生物標志物。同時,文章中的信息學(xué)方法不僅適用于癌癥,未來可用于分析和研究其他多基因突變導(dǎo)致的疾病。UCSD的Trey Ideker教授和UCSF的Nevan Krogan教授共同領(lǐng)導(dǎo)了此項研究。
鄭凡博士(時為UCSD博士后)為此文的第一作者。UCSD的J. Silvio Gutkind教授,Stephanie Fraley教授,和俄勒岡健康與科學(xué)大學(xué)(Oregon Health and Science University)的南小林教授也為本研究提供了關(guān)鍵數(shù)據(jù)。
https://doi.org/10.1126/science.abf3067來源:結(jié)構(gòu)生物學(xué)高精尖創(chuàng)新中心
本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。