3月5日,中國科學院廣州生物醫(yī)藥與健康研究員研究院陳捷凱課題組與南方科技大學研究員Andrew Hutchins課題組合作,開發(fā)出單細胞測序分析轉(zhuǎn)座元件表達的工具包scTE。相關研究成果以Identifying transposable element expression dynamics and heterogeneity during development at the single-cell level with a processing pipeline scTE為題,發(fā)表在Nature Communications上。

轉(zhuǎn)座元件(TEs)是人類基因組中含量最多的遺傳信息之一,是指一類能夠在基因組內(nèi)移動的DNA序列。TEs的插入和跳躍可以改變基因組遺傳信息,是物種進化的重要原動力。盡管大部分TEs已喪失“跳躍”的能力,成為基因組中的“分子化石”。然而,近年來研究發(fā)現(xiàn),TEs可以通過影響染色質(zhì)表觀遺傳修飾、轉(zhuǎn)錄因子結合、RNA編輯及染色質(zhì)構象等,對基因表達起著重要的調(diào)控作用。單細胞轉(zhuǎn)錄組測序(scRNA-seq)是研究細胞命運狀態(tài)的技術,更多的單細胞測序技術及相應的生物信息學分析方法在不斷改進,總體的目標是擴展能捕獲的信息及挖掘能代表生物學功能的潛在維度。目前,從scRNA-seq數(shù)據(jù)分析的工具包均只定量基因的表達,分析TEs的表達較為困難,缺乏相關研究需要的生物信息學分析的工具包,因而忽略了基因組中含量較多的TEs來源的遺傳信息。

研究團隊開發(fā)出可從scRNA-seq數(shù)據(jù)中同時定量基因和TEs的表達的生物信息學工具包——scTE。由于TEs為多拷貝重復序列,與常規(guī)基因不同,同一類TEs通常有成千上萬個不同的拷貝遍布在全基因組,且每個拷貝間的序列高度相似,因此,針對TEs的分析通常難以做到單位點準確定量。為解決這一問題,且由于常規(guī)scRNA-seq只有較短的測序讀長的因素,scTE采用了針對TEs家族層面的定量策略,這一策略忽略了基因組位置信息,提高了TEs的定量準確性。研究團隊利用scTE,通過分析小鼠胚胎發(fā)育和人類疾病scRNA-seq數(shù)據(jù),發(fā)現(xiàn)了一系列細胞命運、疾病狀態(tài)特異性高表達的TEs,提示這些TEs的表達可能與胚胎發(fā)育或疾病的發(fā)生發(fā)展有關,也證明了通過scRNA-seq分析TEs的表達很有必要。

相對scRNA-seq研究轉(zhuǎn)錄組而言,單細胞ATAC-seq(scATAC-seq)等單細胞基因組技術研究的對象是染色質(zhì),染色質(zhì)開放性與表觀遺傳修飾情況在較大程度上決定了基因表達豐度,以scATAC-seq為代表的單細胞基因組學技術的開發(fā),讓獲得“高分辨率”的單細胞精度的染色質(zhì)開放/修飾圖譜變?yōu)榭赡埽欣跇嫿◤腄NA到RNA再到表型的調(diào)控網(wǎng)絡,尋找與表型強相關的核心調(diào)控因子。以scATAC-seq為代表的單細胞基因組測序數(shù)據(jù)存在以下特點:高維度。每個細胞中可以檢測到可能開放的區(qū)域可達幾十萬個;數(shù)據(jù)的稀疏性。由于技術原因,導致大量開放的區(qū)域沒有檢測到信號。由于以上原因,目前對scATAC-seq數(shù)據(jù)的生物信息學存在較大的挑戰(zhàn)。研究團隊提出由于TEs多拷貝的特點,通過累積TEs信號可去除數(shù)據(jù)的稀疏性,降低數(shù)據(jù)的維度,或能夠有效解決scATAC-seq數(shù)據(jù)中的兩個難題。研究團隊利用scTE,發(fā)現(xiàn)僅利用TEs信號,能夠?qū)cATAC-seq數(shù)據(jù)中主要細胞類型區(qū)分,提示TEs信息對scATAC-seq等單細胞基因組數(shù)據(jù)的分析是較好的補充。

科學界普遍認為,TEs被H3K9me3或DNA甲基化等機制沉默,只有在早期胚胎發(fā)育、神經(jīng)細胞等特定少數(shù)細胞類型或細胞受到表觀遺傳藥物干擾時才被激活。科研人員通過scTE的研究,可以發(fā)現(xiàn)發(fā)育過程中存在大量與細胞命運轉(zhuǎn)化過程高度相關的TEs家族,提示TEs參與發(fā)育相關的功能。病理情況下特定細胞TEs的表達也會發(fā)生變化,可能具有病理機制或標志物的研究前景。TEs也被發(fā)現(xiàn)作為增強子參與胚胎發(fā)育和免疫應答,如小鼠中轉(zhuǎn)座元件RLTR13D5作為增強子參與胎盤發(fā)育,靈長類特有的轉(zhuǎn)座元件MER41可作為增強子快速響應干擾素誘導的免疫應答,因此,結合scATAC-seq對TEs區(qū)域的數(shù)據(jù)信息進行挖掘較為必要。scTE能夠幫助科研人員將研究對象擴展到基因之外的常規(guī)研究中大量被忽視的有用的遺傳信息。

生物島實驗室副研究員何江平為論文的第一作者,陳捷凱、Andrew Hutchins為論文的共同通訊作者。

論文鏈接

廣州生物院開發(fā)出單細胞測序分析轉(zhuǎn)座元件表達的工具包-肽度TIMEDOO

scTE原理示意圖