2020年10月19日,國際學術期刊Nucleic Acids Research在線發(fā)布了中國科學院上海營養(yǎng)與健康研究所(中國科學院-馬普學會計算生物學伙伴研究所)王澤峰課題組與生物醫(yī)學大數據中心合作開發(fā)的專門提供各類支持環(huán)狀RNA (circRNAs)翻譯證據的數據庫TransCirchttps://www.biosino.org/transcirc/),該數據庫通過整合多種組學數據來預測特定環(huán)狀RNA編碼蛋白質的潛力并推斷其翻譯產物。文章題為“TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence”。

環(huán)形RNA是一類由反向剪接形成的具有共價閉環(huán)解構的RNA,在真核生物中具有廣泛表達且保守的特點。由于其序列與對應線性RNA大部分重合,因此可以天然通過結合miRNA或RNA結合蛋白(RBP)來調控親本基因的表達。近年來的研究發(fā)現,定位在細胞質中由外顯子構成的環(huán)形RNA也可以發(fā)揮類似mRNA的作用來指導蛋白質的翻譯,這類非帽依賴性翻譯通常在應激反應(如癌癥發(fā)生過程)中上調,是細胞在翻譯水平上改變應激反應途徑的重要表現。

隨著測序技術的發(fā)展,目前有大量的環(huán)形RNA被鑒定出來,與之不匹配的是為數不多的注釋數據庫,TransCirc就是針對這一需求構建的基于多組學證據的環(huán)狀RNA翻譯數據庫。目前,TransCirc中收錄了328080條人類環(huán)狀RNA信息和七類相關證據,其中:1) 核糖體譜(ribosome profiling)鑒定出與核糖體結合的環(huán)狀RNA共4284條;2) 含實驗鑒定的翻譯起始位點(TIS)、內部核糖體進入位點(IRES)和N-6-甲基腺苷修飾位點(m6A)的環(huán)狀RNA分別有10058、314111和40324條;3) 274762條環(huán)狀RNA含環(huán)狀RNA特有編碼框(ORF),其推斷翻譯產物中機器學習預測可形成穩(wěn)定蛋白質和含質譜數據(MS)直接支持的分別有194927和168條。除以上數據外,TransCirc還提供了友好的搜索/瀏覽界面及輔助分析軟件。TransCirc作為研究環(huán)狀RNA翻譯能力及其編碼肽段功能的重要資源,未來將收錄更多相關組學數據并將擴展覆蓋到其他非人物種。

中國科學院上海營養(yǎng)與健康研究所王澤峰研究員和張國慶研究員為文章的共同通訊作者,黃文娣和凌鋆超為共同第一作者。上述研究工作得到了科技部國家重點研發(fā)計劃、中國科學院、國家自然科學基金委和上海市科學技術委員會等經費的支持。(科技處)

原文標題:

TransCirc: an interactive database for translatable circular RNAs based on multi-omics evidence

https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkaa823/5930392

來源:中科院