乳腺癌(breast cancer)是一類因乳腺上皮細(xì)胞增殖失控而導(dǎo)致的惡性腫瘤,其發(fā)病率常年位居女性惡性腫瘤首位,因此它也被稱為“粉紅殺手”!

在我國(guó),乳腺癌的發(fā)病率呈逐年上升趨勢(shì),每年有30余萬女性被診斷出乳腺癌,在東部沿海地區(qū)及經(jīng)濟(jì)發(fā)達(dá)的大城市,乳腺癌發(fā)病率上升尤其明顯。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

截至目前,乳腺癌因異質(zhì)性等因素,其具體病因尚未完全清楚。所幸,隨著基因組大數(shù)據(jù)分析的發(fā)展,人類對(duì)乳腺癌等惡性腫瘤相關(guān)基因突變的認(rèn)知愈漸增多。全基因組關(guān)聯(lián)研究(GWAS)已在150多個(gè)基因組區(qū)域發(fā)現(xiàn)與乳腺癌風(fēng)險(xiǎn)相關(guān)的基因變異。然而,這150多個(gè)基因區(qū)域里僅有不到20個(gè)區(qū)域被詳細(xì)研究,驅(qū)動(dòng)這些關(guān)聯(lián)的大多數(shù)變異和基因仍然是未知的。

近日,《Nature Genetics》刊發(fā)了一篇有關(guān)乳腺癌靶基因精準(zhǔn)定位的研究論文。該研究規(guī)??涨埃蓜虼髮W(xué)、哈佛大學(xué)領(lǐng)銜,458家科研單位的近500位科研人工共同完成。

研究人員利用密集基因型數(shù)據(jù)對(duì)所有已知的乳腺癌風(fēng)險(xiǎn)區(qū)域進(jìn)行精細(xì)繪制,數(shù)據(jù)涉及超過217000名參與者——基因型數(shù)據(jù)來自乳腺癌協(xié)會(huì)聯(lián)合會(huì)(BCAC)和BRCA1/2修飾子研究者聯(lián)盟(CIMBA)。通過人群大數(shù)據(jù)分析以及基因芯片分析,在150個(gè)乳腺癌高風(fēng)險(xiǎn)區(qū)域精準(zhǔn)定位了191個(gè)可能的靶基因。

這些新發(fā)現(xiàn)的乳腺癌基因?qū)椭覀兏敿?xì)地了解乳腺癌是如何產(chǎn)生和發(fā)展的,但目前已知的起作用的基因數(shù)量之多,恰恰突顯了乳腺癌的復(fù)雜性!

所有樣本均使用OncoArray或iCOGS芯片進(jìn)行基因分型,并采用逐步多元邏輯回歸方法識(shí)別各區(qū)域的獨(dú)立關(guān)聯(lián)信號(hào),并在每個(gè)信號(hào)中定義可信因果變量(CCVs)。研究者發(fā)現(xiàn)基因組特征與CCVs有明顯重疊,緊接著,他們使用貝葉斯方法,整合基因組特征和遺傳關(guān)聯(lián)從而精簡(jiǎn)可能的因果變量集,并計(jì)算它們的后驗(yàn)概率。

最后,研究人員整合了遺傳、表觀遺傳表達(dá)以及染色質(zhì)構(gòu)象數(shù)據(jù),以推斷每個(gè)信號(hào)的可能靶基因。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

研究流程圖

1、確定每個(gè)風(fēng)險(xiǎn)區(qū)域的可信因果變量(CCVs)

研究者對(duì)GWASs發(fā)現(xiàn)的150個(gè)乳腺癌風(fēng)險(xiǎn)區(qū)域進(jìn)行了多次互補(bǔ)分析,發(fā)現(xiàn)了362個(gè)獨(dú)立的風(fēng)險(xiǎn)信號(hào),其中205個(gè)具有較高的可信度。他們觀察到,大多數(shù)風(fēng)險(xiǎn)區(qū)域包含多個(gè)獨(dú)立信號(hào),ESR1(雌激素受體)及其共調(diào)控基因周圍區(qū)域的數(shù)量最多(9個(gè))。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

研究者使用了兩種互補(bǔ)的方法來確定每個(gè)乳腺癌風(fēng)險(xiǎn)區(qū)域內(nèi)的CCVs:PAINTOR(一種貝斯葉方法)和傳統(tǒng)的多項(xiàng)式回歸方法。CCVs支持由多項(xiàng)式回歸發(fā)現(xiàn)的大多數(shù)關(guān)聯(lián),并且還確定了額外的變體。具體來說,貝葉斯方法強(qiáng)調(diào)了15個(gè)很可能是因果關(guān)系的變量(HPP≥80%)。從這些方法中,我們?cè)诿?4個(gè)信號(hào)中分別識(shí)別出一個(gè)可能是因果關(guān)系的單一變量。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

在其他信號(hào)中,我們也發(fā)現(xiàn)了四個(gè)之前被認(rèn)為有害的編碼變化:無義突變r(jià)s11571833(BRCA2);兩個(gè)CHEK2編碼變體(移碼突變);和剪接變異體(TERT中的rs10069690,導(dǎo)致端粒酶活性降低、端??s短和DNA損傷反應(yīng)增加等)。

2、揭示CCVs在DNA水平上的功能,并預(yù)測(cè)它們的目標(biāo)基因

值得注意的是,在150個(gè)乳腺癌風(fēng)險(xiǎn)區(qū)域中,許多與ER陽(yáng)性(乳腺癌ER陽(yáng)性率在50%~80%左右)乳腺癌風(fēng)險(xiǎn)相關(guān)的CCVs存在于標(biāo)記為開放和活躍的ER陽(yáng)性乳腺細(xì)胞的基因調(diào)控區(qū)域,而不存在于其他類型的細(xì)胞中。此外,相當(dāng)一部分潛在的CCVs與轉(zhuǎn)錄因子蛋白的結(jié)合位點(diǎn)以及協(xié)同調(diào)節(jié)因子相互重疊。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

9種蛋白(CREBBP、EP300、ESR1、FOXI1、GATA3、MEF2B、MYC、NRIP1和TCF7L2)也出現(xiàn)在高可信度靶基因列表中。這些基因編碼的大多數(shù)蛋白質(zhì)在雌激素信號(hào)傳導(dǎo)通路中發(fā)揮作用。CREBBP、EP300、ESR1、GATA3和MYC也是已知的在乳腺腫瘤中經(jīng)常發(fā)生體細(xì)胞突變的癌癥驅(qū)動(dòng)基因。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

3、與ER陽(yáng)性信號(hào)相比,ER陰性信號(hào)豐富的基因組特征更少

研究者們發(fā)現(xiàn)相較于ER陽(yáng)性信號(hào),ER陰性信號(hào)乳腺癌關(guān)聯(lián)基因更少。BCAC和CIMBA機(jī)構(gòu)的ER陰性腫瘤患者中,不到20%的基因組信號(hào)意味著更大的er陰性乳腺癌風(fēng)險(xiǎn)。除此之外,ER陰性乳腺癌細(xì)胞系的ChIP-Seq公開數(shù)據(jù)很少和ER陰性腫瘤的異質(zhì)性等因素也限制了這方面研究的展開。

盡管如此,本研究還是找尋到35個(gè)ER陰性乳腺癌可能的靶基因。其中一些已經(jīng)有功能證據(jù)支持:CASP8和MDM4。然而,目前大多數(shù)靶點(diǎn)在ER陰性乳腺癌的發(fā)生發(fā)展中沒有報(bào)道。

4、研究靶基因最常存在的基因本體通路

免疫、炎癥和腫瘤發(fā)生之間的聯(lián)系已被廣泛研究,而值得注意的是,14%(25/180)的高可信度靶基因和19%的ER陰性靶基因被預(yù)測(cè)定位于免疫系統(tǒng)途徑中,如T細(xì)胞活化、Toll樣受體級(jí)聯(lián)復(fù)合物以及I-κB/ NF-κB等信號(hào)通路。5個(gè)ER陰性高置信度靶基因(ALK, CASP8, CFLAR, ESR1 和 TNFSF10)位于I-κB/ NF-κB信號(hào)通路中,有趣的是,與ER陽(yáng)性細(xì)胞相比,ER陰性細(xì)胞具有更高水平的NF-kB活性。此外,最近對(duì)乳腺癌腫瘤組織的表達(dá)甲基化分析也發(fā)現(xiàn)了兩個(gè)與DNA甲基化水平相關(guān)的基因簇:一個(gè)富集于ER信號(hào)基因,另一個(gè)富集于免疫通路基因。

史上最大規(guī)模乳腺癌研究:近500個(gè)科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個(gè)乳腺癌相關(guān)基因-肽度TIMEDOO

本研究的領(lǐng)導(dǎo)者,劍橋大學(xué)Alison Dunning博士認(rèn)為,這些令人難以置信的新發(fā)現(xiàn)的乳腺癌基因?yàn)槲覀兲峁┝烁嗟幕蜻M(jìn)行研究,這將幫助我們更詳細(xì)地了解乳腺癌是如何產(chǎn)生和發(fā)展的,但目前已知的起作用的基因數(shù)量之多,恰恰突顯了乳腺癌的復(fù)雜性!

總的來說,本論文的研究分析為200多個(gè)獨(dú)立的乳腺癌風(fēng)險(xiǎn)信號(hào)提供了強(qiáng)有力的證據(jù),確定了許多高可信度的乳腺癌靶基因。雖然每一種基因變異只會(huì)使患乳腺癌的風(fēng)險(xiǎn)增加非常小的一部分,但綜合起來,這些基因變異將讓女性更清楚地了解自己的患病風(fēng)險(xiǎn),這也將使醫(yī)生和臨床醫(yī)生能夠就降低乳腺癌風(fēng)險(xiǎn)提供最佳策略。

參考資料:

[1] Fine-mapping of 150 breast cancer risk regions identifies 191 likely target genes

來源:BioWorld