費(fèi)城兒童醫(yī)院(CHOP)的一個(gè)研究團(tuán)隊(duì)開(kāi)發(fā)了一種創(chuàng)新的計(jì)算工具,為研究人員從DNA中復(fù)制RNA時(shí)檢測(cè)RNA的不同剪接方式提供了一種有效的方法。由于RNA剪接的變化在許多疾病中起著至關(guān)重要的作用,這種新的分析工具將為尋找疾病生物標(biāo)志物和治療靶點(diǎn)提供更大的能力,即使是從覆蓋率適中的RNA測(cè)序數(shù)據(jù)集。
研究負(fù)責(zé)人易星博士和CHOP計(jì)算與基因組醫(yī)學(xué)中心的第一作者、博士生張子君、潘志成博士本周報(bào)告了他們關(guān)于自然方法的DARTS框架。Darts(轉(zhuǎn)錄物剪接的深度學(xué)習(xí)增強(qiáng)RNA-seq分析)使用基于深度學(xué)習(xí)的預(yù)測(cè)來(lái)利用RNA測(cè)序(RNA-seq)的公共數(shù)據(jù)集中的大量可用信息,從而允許對(duì)替代剪接的新見(jiàn)解。
“DARTS的概念創(chuàng)新在于,它提供了一個(gè)從公共領(lǐng)域的大數(shù)據(jù)到小數(shù)據(jù)集的橋梁,以便與單個(gè)研究人員進(jìn)行關(guān)鍵研究,”Xing說(shuō)?!癉ARTS提供了將大量公開(kāi)的RNA-seq數(shù)據(jù)轉(zhuǎn)化為知識(shí)庫(kù)(表示為深度神經(jīng)網(wǎng)絡(luò))來(lái)調(diào)控剪接的能力。利用這個(gè)計(jì)算框架,我們可以把它推廣到任何一個(gè)實(shí)驗(yàn)室。這可能很有用,可以提高實(shí)驗(yàn)效率,實(shí)現(xiàn)新發(fā)現(xiàn)。只需2000萬(wàn)或3000萬(wàn)個(gè)RNA-seq讀數(shù),你就可以對(duì)你從未見(jiàn)過(guò)的事物做出明智的猜測(cè)和推斷?!?
邢長(zhǎng)期致力于選擇性剪接——將單個(gè)基因的DNA信息以不同的方式拼接在一起,在基因轉(zhuǎn)錄后產(chǎn)生不同的信使RNA和蛋白質(zhì)產(chǎn)物。每個(gè)基因平均產(chǎn)生10個(gè)或更多這樣的產(chǎn)物,有時(shí)多達(dá)38,000個(gè)。這些選擇性剪接的變異可能會(huì)導(dǎo)致疾病,改變疾病的風(fēng)險(xiǎn),或者使疾病變得更輕或更嚴(yán)重。
大規(guī)模平行RNA測(cè)序現(xiàn)在是研究人員用來(lái)研究選擇性剪接的標(biāo)準(zhǔn)技術(shù)。然而,為了準(zhǔn)確測(cè)量選擇性剪接,RNA測(cè)序?qū)嶒?yàn)必須非常徹底。人們一致認(rèn)為,對(duì)選擇性剪接的分析需要超過(guò)1億個(gè)序列,但由于成本高,大多數(shù)研究人員負(fù)擔(dān)不起他們的核糖核酸測(cè)序?qū)嶒?yàn)。此外,許多醫(yī)學(xué)上重要的基因沒(méi)有高水平表達(dá)。即使是深度RNA測(cè)序?qū)嶒?yàn),也無(wú)法對(duì)這些基因產(chǎn)生足夠的覆蓋,因此幾乎無(wú)法測(cè)量基因的選擇性剪接模式。
在目前的研究中,邢的團(tuán)隊(duì)首先利用國(guó)家人類基因組研究所發(fā)起的國(guó)際項(xiàng)目ENCODE Con sortium的大規(guī)模公共域RNA測(cè)序數(shù)據(jù),鑒定基因組中的所有功能元件,包括那些在RNA水平上發(fā)揮作用的元件。利用這些海量的數(shù)據(jù)集,DARTS訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)選擇性剪接的變化。該模型包含1500個(gè)核糖核酸結(jié)合蛋白的信使核糖核酸水平和3000個(gè)序列特征。
為了讓研究人員在自己的研究中使用深度學(xué)習(xí)模型,深度神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)使用一種稱為貝葉斯假設(shè)檢驗(yàn)的統(tǒng)計(jì)框架,與特定生物樣本上生成的實(shí)際核糖核酸測(cè)序數(shù)據(jù)相結(jié)合。研究人員可以在各自的實(shí)驗(yàn)室中使用這些信息來(lái)更好地表征不同生物條件下的選擇性剪接。
研究人員將DARTS應(yīng)用于肺癌和前列腺癌細(xì)胞系,以測(cè)試它們預(yù)測(cè)細(xì)胞剪接模式的能力。這些細(xì)胞系是上皮細(xì)胞向間充質(zhì)細(xì)胞過(guò)渡的模型——胚胎發(fā)育和癌癥轉(zhuǎn)移的重要過(guò)程。通過(guò)深度學(xué)習(xí)預(yù)測(cè),DARTS發(fā)現(xiàn)了許多基因中替代剪接模式的變化,這些變化由于在細(xì)胞中低水平表達(dá)而逃過(guò)了傳統(tǒng)計(jì)算工具的檢測(cè)。研究小組隨后進(jìn)行了實(shí)驗(yàn)來(lái)驗(yàn)證這些新穎的預(yù)測(cè)。這些新發(fā)現(xiàn)可能使科學(xué)家能夠更好地識(shí)別疾病的生物標(biāo)志物和治療目標(biāo)。
“DARTS提供了一個(gè)令人興奮的概念框架,我們可以適應(yīng)其他用途,”Xing補(bǔ)充道。"例如,我們可以創(chuàng)建一個(gè)版本,預(yù)測(cè)特定患者組織中的選擇性剪接."這可能有助于通過(guò)組織活檢來(lái)提高罕見(jiàn)疾病的診斷,組織活檢是一種在兒科中心(如CHOP)使用的有用技術(shù),通??梢栽u(píng)估兒童是否患有可疑或未診斷的疾病。
邢總結(jié)說(shuō),DARTS可以讓科學(xué)家發(fā)現(xiàn)更多未探索基因的貢獻(xiàn),這些基因可能不會(huì)在高水平上表達(dá),但對(duì)健康和疾病有重要影響?!癉ARTS為轉(zhuǎn)錄組中的暗物質(zhì)提供了一個(gè)新的窗口,”他說(shuō)。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!