相信單細胞領域的小伙伴們對SCENIC分析(Single-Cell Regulatory Network Inference And Clustering)并不陌生,但如何升華該分析的生物學意義?如何將自己的結果制作成高分文章的樣子(SCENIC熱圖)?難倒的英雄好漢應該不少。(趕緊關注我們吧~為您講解詳細的ScRNA-Seq數(shù)據(jù)分析結果,及具體分析工具?。。。?
? SCENIC分析高分文章案例分享:
SCENIC分析是對ScRNA-Seq數(shù)據(jù)中轉錄因子(Transcription Factors,TFs)進行研究,最終篩選得到調控強度顯著、處于核心作用的TFs,結果通常以熱圖形式展示。尤其在腫瘤學中,SCENIC分析可以幫助找到與腫瘤發(fā)生發(fā)展相關的關鍵“驅動基因(Driver)”,從而為探究其發(fā)病機制奠定基礎。
圖1 肺癌組織中內皮細胞SCENIC分析熱圖
(圖片來源于文獻Lambrechts, D., et al. "Phenotype molding of stromal cells in the lung tumor microenvironment. " Nature Medicine 24.8(2018):1277. IF=32.621)
圖1為肺癌組織中內皮細胞SCENIC分析結果。其中,EHF在腫瘤中表達具有異質性,在腫瘤發(fā)生及不同階段發(fā)揮不同作用。從圖1可以看出,與非惡性內皮細胞相比,EHF在Tumour細胞中具有較顯著的調控作用,提示可以進一步研究EHF通過開啟下游何種信號通路調控Tumour細胞的增殖與遷移,進而影響肺癌進展。
? SCENIC分析工具
圖2 SCENIC分析流程
l step 1:采用grnboost2識別并篩選出與TFs共表達(co-expression)的基因。注意:其中部分基因僅與TFs表達相關,而非靶基因;
l step 2:使用RcisTarget對每個共表達模塊進行顯著性Motif富集,篩選得到顯著表達的靶基因,我們將每一對TFs與靶基因的組合稱為調節(jié)子(regulons)。
l step 3:采用AUCell算法對每一組regulon的轉錄活性進行打分,從而確定TFs對靶基因的調控強度(圖2)。
(算法參考文獻:Aibar, Sara, et al. "SCENIC: single-cell regulatory network inference and clustering." Nature methods 14.11 (2017): 1083.)
? 烈冰科技SCENIC分析工作流搭建
? 結果展示
小編以發(fā)表于《Nature》的腦組織測序數(shù)據(jù)為Demo,進行了SCENIC分析,結果如下:
1. TFs調控強度t-SNE圖
我們根據(jù)AUCell算法對TFs調控強度的打分值進行染色,繪制了不同TFs在各細胞中調控強度的 t-SNE圖(圖4)。結合鑒定的細胞類型,得到轉錄因子ISL1在GABA神經(jīng)元中調控強度較高,SOX5則高強度調控谷氨酸能神經(jīng)元,FOXA1在星形膠質細胞中調控作用較高,E2F1則顯著調控中間前體細胞與放射狀膠質細胞。
圖4 不同TFs的調控強度
(數(shù)據(jù)來源:Birey F , Andersen J , Makinson C D , et al. Assembly of functionally integrated human forebrain spheroids[J]. Nature, 2017.)
2. TFs調控的靶基因
表1記錄了每個TF調控的靶基因及對應的調控強度(僅展示調控強度Top20的regulons)。TFs所調控的靶基因往往不止一個,如FOXA1可以調控靶基因SPON1、NTN1和SULF1。該部分結果將為后續(xù)篩選關鍵TFs提供一定的依據(jù)。
表1 TFs調控的靶基因及其調控強度
3. TFs調控強度熱圖
圖5展示了該腦組織各神經(jīng)細胞類型調控強度較高的TFs熱圖(一般文章發(fā)表時多采用此圖),可以從圖中挑選出特定細胞類型高調控強度的TFs,為下一步Driver的研究和驗證奠定基礎。以此圖為例,可以看出E2F家族在中間前體細胞中調控作用顯著增強,提示E2F可能成為中間前體細胞群體中的驅動基因。
圖5 TFs調控強度的熱圖
? SCENIC分析拓展
SCENIC分析不僅可以用于篩選得到有價值的TFs,還可以結合其他的驗證手段或數(shù)據(jù)分析工具來探索更深層次的生物學意義。這里小編為大家提供了一些TFs后續(xù)研究的分析思路,歡迎大家在下方留言~:
1. 在研究某種疾病進展(如腫瘤的復發(fā)、轉移)時,我們可以針對特定的細胞類型,對該細胞類型進行SCENIC分析,找到與復發(fā)、轉移特定功能相關的TFs及其靶基因,從而通過分子生物學手段(敲低/過表達等)在體外進一步驗證。
2. 結合基因模塊(gene module)分析及TFs注釋,判斷TFs是否是關鍵基因(hub-gene),分析其調控的相關通路和靶基因,建立起以TFs為驅動中心的調控網(wǎng)絡。