近幾十年來(lái),生物和生物醫(yī)學(xué)研究領(lǐng)域(如基因組學(xué)、蛋白質(zhì)組學(xué)和轉(zhuǎn)錄組學(xué))不同學(xué)科的快速發(fā)展導(dǎo)致可用生物數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng)。例如,在歐洲生物信息學(xué)研究所(EMBL-EBI),他們?cè)诙潭?年內(nèi)就從管理40PB的容量發(fā)展到使用250PB的容量。
由ICREA研究員兼IRB巴塞羅那結(jié)構(gòu)生物信息學(xué)和網(wǎng)絡(luò)生物學(xué)實(shí)驗(yàn)室負(fù)責(zé)人PatrickAloy博士領(lǐng)導(dǎo)的科學(xué)家們開(kāi)發(fā)了一種計(jì)算工具來(lái)協(xié)調(diào)、整合和簡(jiǎn)化這些數(shù)據(jù)。結(jié)果是一個(gè)知識(shí)圖譜,提供了有關(guān)不同生物實(shí)體如何相互關(guān)聯(lián)的信息,包括超過(guò)3000萬(wàn)個(gè)功能交互。
Bioteque通過(guò)整合不同級(jí)別的生物復(fù)雜性來(lái)工作,因此可以報(bào)告例如兩個(gè)相關(guān)的基因,它們是否物理相互作用,它們是否在同一類型的細(xì)胞中活躍,以及它們是否與同一疾病有關(guān).它還可以預(yù)測(cè)一種細(xì)胞對(duì)特定藥物的敏感性或抗性。
“我們開(kāi)發(fā)的這種計(jì)算資源是最早旨在統(tǒng)一生物信息的計(jì)算資源之一,也是唯一能夠解決這種多樣性和數(shù)據(jù)量問(wèn)題的計(jì)算資源。它允許以簡(jiǎn)單和協(xié)調(diào)的方式訪問(wèn)幾乎所有的生物知識(shí)目前可用,它具有加速生物醫(yī)學(xué)研究的巨大潛力,”Aloy解釋說(shuō)。
符
Bioteque中保存的信息被結(jié)構(gòu)化為12種生物實(shí)體,例如基因、疾病、組織、細(xì)胞等。對(duì)于這些實(shí)體中的每一個(gè),該工具都會(huì)考慮一系列描述符或特征,例如突變模式基因、所得蛋白質(zhì)的物理相互作用的概況、所述基因在不同細(xì)胞類型中的表達(dá)或其與不同疾病的關(guān)系。在12個(gè)生物實(shí)體中,該系統(tǒng)涵蓋了大約1000種描述符。
“我們已經(jīng)處理了來(lái)自150個(gè)不同數(shù)據(jù)庫(kù)的信息,所以首先我們必須整合它們,也就是說(shuō),將它們?nèi)糠旁谕环N‘語(yǔ)言’中。然后我們將這些知識(shí)轉(zhuǎn)化為可以被算法解釋的數(shù)字描述符,然后我們可以通過(guò)計(jì)算方式利用這些網(wǎng)絡(luò)和連接,”該文章的第一作者和同一實(shí)驗(yàn)室的博士生AdriàFernández總結(jié)道。
突出顯示了與疾病及其治療相關(guān)的三個(gè)組。信用:IRB巴塞羅那
Bioteque將隨著新數(shù)據(jù)庫(kù)的公開(kāi)而定期擴(kuò)展。該工具以及數(shù)據(jù)庫(kù)和算法都是開(kāi)放訪問(wèn)的,并且可以在線獲得。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!