2024年10月16日,北京華大生命科學(xué)研究院最新成果以封面文章形式發(fā)表于Cell Systems。該成果介紹了時(shí)空轉(zhuǎn)錄組去噪算法SpotGF,闡釋了這套算法如何識(shí)別并過(guò)濾噪聲基因,有效降低時(shí)空組數(shù)據(jù)中的噪聲,并避免新的假陽(yáng)性信號(hào)。
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時(shí)空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOOCell Systems官網(wǎng)截圖
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時(shí)空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOO
Cell Systems10月封面
理想情況下,基因表達(dá)應(yīng)在其原位被捕獲。華大自主研發(fā)的時(shí)空組學(xué)技術(shù)(Stereo-seq)就是一種結(jié)合了基因表達(dá)信息與細(xì)胞空間位置的空間轉(zhuǎn)錄組技術(shù),能夠幫助科研人員探究基因表達(dá)在組織和器官中的空間分布。
但在實(shí)際操作中,不同細(xì)胞類(lèi)型的差異、實(shí)驗(yàn)環(huán)境中難以預(yù)測(cè)的分子熱運(yùn)動(dòng)、建庫(kù)過(guò)程中的反轉(zhuǎn)錄和擴(kuò)增步驟、數(shù)據(jù)分析中參數(shù)和算法的不當(dāng)使用等情況都有可能增加噪聲或假陽(yáng)性的信號(hào)。
因此,開(kāi)發(fā)高效的去噪算法來(lái)獲取準(zhǔn)確的空間轉(zhuǎn)錄組數(shù)據(jù),對(duì)于后續(xù)生物學(xué)問(wèn)題的解讀至關(guān)重要。
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時(shí)空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOO
SpotGF去噪算法技術(shù)原理及應(yīng)用
為此,研究團(tuán)隊(duì)開(kāi)發(fā)了SpotGF去噪算法,算法基于最優(yōu)傳輸理論,定量分析了每個(gè)基因表達(dá)的擴(kuò)散程度,從而準(zhǔn)確識(shí)別并過(guò)濾那些因擴(kuò)散而變得無(wú)效的基因,這些無(wú)效基因通常無(wú)法為生物信息學(xué)分析提供價(jià)值。
與以往依賴數(shù)學(xué)統(tǒng)計(jì)模型來(lái)調(diào)整原始基因表達(dá)量的去噪方法不同,SpotGF在去除無(wú)效基因的同時(shí),保留了有效基因的原始表達(dá),從而避免引入新的假陽(yáng)性信號(hào),提高了分析的準(zhǔn)確性。
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時(shí)空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOOSpotGF與現(xiàn)有去噪算法在大豆根尖Stereo-seq數(shù)據(jù)中的性能比較
SpotGF適用于多種生物信息學(xué)框架,研究人員還將其與目前廣泛使用的去噪算法如Magic、SpotClean、Sprod等進(jìn)行了比較。結(jié)果表明,在各項(xiàng)指標(biāo)上SpotGF均展現(xiàn)出了更優(yōu)越的性能,并顯著提升了包括Stereo-seq在內(nèi)的一系列空間轉(zhuǎn)錄組數(shù)據(jù)的聚類(lèi)效果,更準(zhǔn)確地鑒定出了細(xì)胞類(lèi)型的特征基因。
如何獲取高質(zhì)量的空間轉(zhuǎn)錄組數(shù)據(jù)一直是研究人員面臨的挑戰(zhàn)。SpotGF算法通過(guò)精準(zhǔn)去除數(shù)據(jù)中的噪聲,顯著提高了空間轉(zhuǎn)錄組數(shù)據(jù)的信噪比,使得細(xì)胞聚類(lèi)、細(xì)胞類(lèi)型注釋和差異表達(dá)等分析結(jié)果更加精確。這為理解復(fù)雜生物系統(tǒng)中的基因調(diào)控網(wǎng)絡(luò)、信號(hào)傳導(dǎo)途徑,以及細(xì)胞間的相互作用提供了強(qiáng)有力的工具。
北京華大生命科學(xué)研究院2021級(jí)國(guó)科大直博生杜琳為論文的第一作者,北京華大生命科學(xué)研究院的孫海汐和張博涵為論文的共同通訊作者。該研究得到了國(guó)家重點(diǎn)研發(fā)計(jì)劃的資助。該研究依托深圳國(guó)家基因庫(kù)完成全部生物信息學(xué)數(shù)據(jù)分析,原始測(cè)序數(shù)據(jù)存儲(chǔ)于國(guó)家基因庫(kù)序列歸檔系統(tǒng)CNSA。編輯:李麗