外泌體是近年的研究熱點(diǎn),作為納米級(jí)別的小囊泡卻有強(qiáng)大的功能和應(yīng)用前景,特別是存在于體液中,是目前液體活檢關(guān)注的重要領(lǐng)域。長(zhǎng)鏈RNA包括mRNA、lncRNA和circRNA等,這些RNA數(shù)量多且存在很多組織細(xì)胞特異表達(dá)信息,近年發(fā)現(xiàn)它們可能被外泌體包裹釋放到體液中,可作為疾病的診斷標(biāo)志物或功能靶點(diǎn),對(duì)外泌體長(zhǎng)鏈RNA的研究正備受關(guān)注。黃勝林課題組在前期基礎(chǔ)上,改進(jìn)并完善了血液外泌體長(zhǎng)鏈RNA的高通量測(cè)序方法,發(fā)現(xiàn)血液外泌體存在著眾多的mRNA、lncRNA和circRNA。exoRBase正是基于這些分析基礎(chǔ)上建立,旨在收錄正常人和不同疾病患者血液外泌體里所有的長(zhǎng)鏈RNA信息及其表達(dá)特征。exoRBase建立了一套針對(duì)外泌體RNA測(cè)序數(shù)據(jù)分析的標(biāo)準(zhǔn)流程,對(duì)環(huán)狀RNA進(jìn)行了預(yù)測(cè)和注釋分析,同時(shí)比對(duì)和定量了lncRNA和mRNA表達(dá)情況。數(shù)據(jù)庫(kù)可從多種角度(基因名、染色體定位、circRNA關(guān)聯(lián)基因等)進(jìn)行檢索,并找到具有不同特性的外泌體RNA,及其組織特異性、疾病關(guān)聯(lián)性和表達(dá)情況。exoRBase將為外泌體長(zhǎng)鏈RNA研究和液體診斷提供有力的信息平臺(tái)和靶點(diǎn)。
該數(shù)據(jù)庫(kù)的基礎(chǔ)RNA測(cè)序數(shù)據(jù)分析主要是基于烈冰科技的NovelBrain®云平臺(tái)。烈冰科技自主開(kāi)發(fā)的基因大數(shù)據(jù)分析平臺(tái)(NovelBrain®)擁有強(qiáng)大的高性能計(jì)算能力、完善的樣本及大數(shù)據(jù)管理系統(tǒng),同時(shí)具備深度挖掘能力,并支持定制化分析模塊自主上線。在國(guó)內(nèi)初次實(shí)現(xiàn)了Hadoop-Docker生物信息框架,選取了Hadoop生態(tài)系統(tǒng)中的hdfs、zookeeper和YARN組件,并進(jìn)行了一系列不同程度的優(yōu)化,自主搭建了NovelBrain®科研云平臺(tái)的分布式底層框架。同時(shí)采用輕量虛擬化技術(shù)Docker,并修改了Hadoop-YARN的底層代碼,優(yōu)化了其對(duì)Docker的支持,一方面實(shí)現(xiàn)了計(jì)算隔離,保證了系統(tǒng)的安全性;另一方面通過(guò)虛擬化機(jī)制實(shí)現(xiàn)分析軟件和算法的一致性,保證數(shù)據(jù)分析可重現(xiàn)。在保證高效率并行計(jì)算的基礎(chǔ)上,NovelBrain®開(kāi)創(chuàng)了從任務(wù)投遞、數(shù)據(jù)切分到容器多線程的三重調(diào)度加速框架,充分利用計(jì)算資源,大幅提高分析效率。NovelBrain®全程使用并實(shí)現(xiàn)“零代碼”,解決了數(shù)據(jù)無(wú)法自動(dòng)分析、軟件操作難度大、分析需求無(wú)法定制和結(jié)果無(wú)法解讀等問(wèn)題。
目前,NovelBrain®云計(jì)算平臺(tái)具備基因組、轉(zhuǎn)錄組、微生物和表觀遺傳學(xué)等模塊,現(xiàn)已實(shí)現(xiàn)外顯子組、小RNA、circRNA、ChIP-Seq等數(shù)十條分析工作流,并內(nèi)置了上百個(gè)數(shù)據(jù)分析功能task簇,能滿足科研工作者的日常分析需求。
復(fù)旦腫瘤所黃勝林課題組聚焦于腫瘤表觀遺傳和生物信息研究,近年在外泌體和環(huán)狀RNA方面有一定的研究成果,在研究所建立了RNA高通量測(cè)序和生物信息平臺(tái)?;谂c烈冰科技共同開(kāi)發(fā)的NovelBrain®科研云計(jì)算平臺(tái),開(kāi)展了研究所高通量測(cè)序平臺(tái)的常規(guī)分析,同時(shí)進(jìn)行了深度分析流程開(kāi)發(fā),建立了外泌體長(zhǎng)RNA分析等流程。烈冰科技希望通過(guò)與科研團(tuán)隊(duì)的深入合作,為更多的科研工作者提供高品質(zhì)的數(shù)據(jù)解讀服務(wù),強(qiáng)強(qiáng)聯(lián)合,促使生命科學(xué)向更高層的研究領(lǐng)域突破。