




【科學網】研究開發單細胞測序分析TEs表達的工具包
中國科學院廣州生物醫藥與健康研究院(以下簡稱廣州健康院)陳捷凱課題組和南方科技大學Andrew Hutchins課題組合作開發出單細胞測序分析轉座元件表達的工具包scTE。相關研究3月5日發表于《自然—通訊》。據悉,生物島實驗室副研究員何江平為該論文第一作者,陳捷凱、Andrew Hutchins為論文共同通訊作者。
轉座元件(TEs)是人類基因組中含量最多的遺傳信息,是指一類能夠在基因組內移動的DNA序列。TEs的插入和跳躍可以改變基因組遺傳信息,是物種進化的重要原動力。盡管大部分TEs已經喪失了“跳躍”的能力,成為了基因組中的“分子化石”。但近年來研究發現,TEs可以通過影響染色質表觀遺傳修飾、轉錄因子結合、RNA編輯以及染色質構象等,對基因表達起著非常重要的調控作用。
據介紹,單細胞轉錄組測序(scRNA-seq)是研究細胞命運狀態的絕佳技術。近年來,更多的單細胞測序技術以及相應的生物信息學分析方法也在不斷改進,總體的目標是擴展能捕獲的信息及挖掘能代表生物學功能的潛在維度。然而,目前從scRNA-seq數據分析的工具包都只定量基因的表達,分析TEs的表達還比較困難,缺乏相關研究需要的生物信息學分析的工具包,因而忽略了基因組中含量最多的TEs來源的遺傳信息。
為填補這一研究的空白,研究人員開發了能夠從scRNA-seq數據中同時定量基因和TEs的表達的生物信息學工具包——scTE。由于TEs為多拷貝重復序列,與常規基因不同,同一類TEs通常有成千上萬個不同的拷貝遍布在全基因組,并且每個拷貝間的序列高度相似,因此,針對TEs的分析通常難以做到單位點準確定量。
為解決這一問題,同時由于常規scRNA-seq只有較短的測序讀長的因素,scTE采用了針對TEs家族層面的定量策略,這一策略忽略了基因組位置信息,提高了TEs的定量準確性。研究人員利用scTE,通過分析小鼠胚胎發育和人類疾病scRNA-seq數據,發現了一系列細胞命運、疾病狀態特異性高表達的TEs,提示這些TEs的表達可能與胚胎發育或疾病的發生發展有關,也證明了通過scRNA-seq分析TEs的表達很有必要。
相對scRNA-seq研究轉錄組而言,單細胞ATAC-seq(scATAC-seq)等單細胞基因組技術研究的對象是染色質,染色質開放性與表觀遺傳修飾情況在很大程度上決定了基因表達豐度,以scATAC-seq為代表的單細胞基因組學技術的開發,讓獲得“高分辨率”的單細胞精度的染色質開放/修飾圖譜變為可能,有利于構建從DNA到RNA再到表型的調控網絡,尋找與表型強相關的核心調控因子。
然而,以scATAC-seq為代表的單細胞基因組測序數據存在幾個特點:一、高維度。每個細胞中可以檢測到可能開放的區域可以高達幾十萬個;二、數據的稀疏性。由于技術原因,導致大量開放的區域沒有檢測到信號。由于以上原因,目前對scATAC-seq數據的生物信息學還存在比較大的挑戰。
研究人員提出由于TEs多拷貝的特點,通過累積TEs信號可以去除數據的稀疏性,降低數據的維度,或許能夠有效解決scATAC-seq數據以上難題。他們利用scTE,發現僅利用TEs信號,能夠將scATAC-seq數據中主要細胞類型區分開來,提示TEs信息對scATAC-seq等單細胞基因組數據的分析是很好的補充。
相關論文信息:https://doi.org/10.1038/s41467-021-21808-x