費(fèi)城兒童醫(yī)院(CHOP)的一個(gè)研究團(tuán)隊(duì)開發(fā)了一種創(chuàng)新的計(jì)算工具,為研究人員從DNA中復(fù)制RNA時(shí)檢測RNA的不同剪接方式提供了一種有效的方法。由于RNA剪接的變化在許多疾病中起著至關(guān)重要的作用,這種新的分析工具將為尋找疾病生物標(biāo)志物和治療靶點(diǎn)提供更大的能力,即使是從覆蓋率適中的RNA測序數(shù)據(jù)集。
研究負(fù)責(zé)人易星博士和CHOP計(jì)算與基因組醫(yī)學(xué)中心的第一作者、博士生張子君、潘志成博士本周報(bào)告了他們關(guān)于自然方法的DARTS框架。Darts(轉(zhuǎn)錄物剪接的深度學(xué)習(xí)增強(qiáng)RNA-seq分析)使用基于深度學(xué)習(xí)的預(yù)測來利用RNA測序(RNA-seq)的公共數(shù)據(jù)集中的大量可用信息,從而允許對替代剪接的新見解。
“DARTS的概念創(chuàng)新在于,它提供了一個(gè)從公共領(lǐng)域的大數(shù)據(jù)到小數(shù)據(jù)集的橋梁,以便與單個(gè)研究人員進(jìn)行關(guān)鍵研究,”Xing說?!癉ARTS提供了將大量公開的RNA-seq數(shù)據(jù)轉(zhuǎn)化為知識(shí)庫(表示為深度神經(jīng)網(wǎng)絡(luò))來調(diào)控剪接的能力。利用這個(gè)計(jì)算框架,我們可以把它推廣到任何一個(gè)實(shí)驗(yàn)室。這可能很有用,可以提高實(shí)驗(yàn)效率,實(shí)現(xiàn)新發(fā)現(xiàn)。只需2000萬或3000萬個(gè)RNA-seq讀數(shù),你就可以對你從未見過的事物做出明智的猜測和推斷?!?
邢長期致力于選擇性剪接——將單個(gè)基因的DNA信息以不同的方式拼接在一起,在基因轉(zhuǎn)錄后產(chǎn)生不同的信使RNA和蛋白質(zhì)產(chǎn)物。每個(gè)基因平均產(chǎn)生10個(gè)或更多這樣的產(chǎn)物,有時(shí)多達(dá)38,000個(gè)。這些選擇性剪接的變異可能會(huì)導(dǎo)致疾病,改變疾病的風(fēng)險(xiǎn),或者使疾病變得更輕或更嚴(yán)重。
大規(guī)模平行RNA測序現(xiàn)在是研究人員用來研究選擇性剪接的標(biāo)準(zhǔn)技術(shù)。然而,為了準(zhǔn)確測量選擇性剪接,RNA測序?qū)嶒?yàn)必須非常徹底。人們一致認(rèn)為,對選擇性剪接的分析需要超過1億個(gè)序列,但由于成本高,大多數(shù)研究人員負(fù)擔(dān)不起他們的核糖核酸測序?qū)嶒?yàn)。此外,許多醫(yī)學(xué)上重要的基因沒有高水平表達(dá)。即使是深度RNA測序?qū)嶒?yàn),也無法對這些基因產(chǎn)生足夠的覆蓋,因此幾乎無法測量基因的選擇性剪接模式。
在目前的研究中,邢的團(tuán)隊(duì)首先利用國家人類基因組研究所發(fā)起的國際項(xiàng)目ENCODE Con sortium的大規(guī)模公共域RNA測序數(shù)據(jù),鑒定基因組中的所有功能元件,包括那些在RNA水平上發(fā)揮作用的元件。利用這些海量的數(shù)據(jù)集,DARTS訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)來預(yù)測選擇性剪接的變化。該模型包含1500個(gè)核糖核酸結(jié)合蛋白的信使核糖核酸水平和3000個(gè)序列特征。
為了讓研究人員在自己的研究中使用深度學(xué)習(xí)模型,深度神經(jīng)網(wǎng)絡(luò)預(yù)測使用一種稱為貝葉斯假設(shè)檢驗(yàn)的統(tǒng)計(jì)框架,與特定生物樣本上生成的實(shí)際核糖核酸測序數(shù)據(jù)相結(jié)合。研究人員可以在各自的實(shí)驗(yàn)室中使用這些信息來更好地表征不同生物條件下的選擇性剪接。
研究人員將DARTS應(yīng)用于肺癌和前列腺癌細(xì)胞系,以測試它們預(yù)測細(xì)胞剪接模式的能力。這些細(xì)胞系是上皮細(xì)胞向間充質(zhì)細(xì)胞過渡的模型——胚胎發(fā)育和癌癥轉(zhuǎn)移的重要過程。通過深度學(xué)習(xí)預(yù)測,DARTS發(fā)現(xiàn)了許多基因中替代剪接模式的變化,這些變化由于在細(xì)胞中低水平表達(dá)而逃過了傳統(tǒng)計(jì)算工具的檢測。研究小組隨后進(jìn)行了實(shí)驗(yàn)來驗(yàn)證這些新穎的預(yù)測。這些新發(fā)現(xiàn)可能使科學(xué)家能夠更好地識(shí)別疾病的生物標(biāo)志物和治療目標(biāo)。
“DARTS提供了一個(gè)令人興奮的概念框架,我們可以適應(yīng)其他用途,”Xing補(bǔ)充道。"例如,我們可以創(chuàng)建一個(gè)版本,預(yù)測特定患者組織中的選擇性剪接."這可能有助于通過組織活檢來提高罕見疾病的診斷,組織活檢是一種在兒科中心(如CHOP)使用的有用技術(shù),通??梢栽u估兒童是否患有可疑或未診斷的疾病。
邢總結(jié)說,DARTS可以讓科學(xué)家發(fā)現(xiàn)更多未探索基因的貢獻(xiàn),這些基因可能不會(huì)在高水平上表達(dá),但對健康和疾病有重要影響?!癉ARTS為轉(zhuǎn)錄組中的暗物質(zhì)提供了一個(gè)新的窗口,”他說。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!