隨著澳大利亞和北美研究人員開發(fā)的新開源數據庫的發(fā)布,共享揭示基因組變異在健康和疾病中的功能的數據集變得更加容易。
MaveDB數據庫是存儲來自實驗數據的數據的存儲庫(稱為突變效應的多重測量)。該系統(tǒng)可以系統(tǒng)地測量數千個單序列變異對基因功能的影響。這些實驗可以提供有價值的信息,說明該基因產生的蛋白質是如何發(fā)揮作用的,該基因的變體是如何引起疾病的,以及如何設計一種比原始蛋白質更有效的天然蛋白質的合成形式。
MaveDB是第一個可以公開訪問這些數據的數據庫。它的發(fā)展由澳大利亞沃爾特和伊萊扎霍爾學院的艾倫魯賓博士、美國華盛頓大學副教授道格拉斯福勒和加拿大多倫多大學的弗雷德里克羅斯教授領導。MaveDB在今天的《基因組生物學》雜志中有描述。
乍一看
新開發(fā)的數據庫MaveDB增強了復雜功能基因組數據集的共享。
MaveDB是一個易于使用的存儲庫,用于存儲來自多次突變效應分析(MAVE)的數據,用于解釋窮盡測量不同基因突變效應的實驗結果。
MaveDB增強了研究人員獲取和解釋復雜功能基因組數據的能力,從而加快了對基因的基礎生物學、基因在疾病中的作用以及如何工程蛋白質以創(chuàng)造更有效的變體的研究。
加強基因組學研究
魯賓博士說,MAVE徹底改變了研究人員理解基因功能及其在疾病中的作用的能力。
他說:“過去,研究人員必須關注基因的一些變化,才能了解它們的功能?!彼f:“通過徹底掃描可能有數百或數千個堿基的基因變異來生成數據太復雜了。
“微型飛行器的發(fā)展為研究人員提供了一種方法,通過實驗來測量基因的每個個體遺傳變化及其功能后果。這些檢測方法可以處理成千上萬的基因變異,這樣研究人員就可以探索相關的變化,并將其放在背景中”。
迄今為止,來自實驗的MAVE數據是孤立存在的。當研究論文發(fā)表或應要求提供給其他研究人員時,個別研究的數據將被上傳到期刊網站。
魯賓博士說:“這使得研究人員很難獲得其他群體的數據,甚至很難知道已經進行了一項特定的MAVE實驗。因此,這可能會阻礙合作和基因組學研究的進展?!?
“MaveDB采用了一種適用于多個研究領域的靈活格式,這使得科學家可以更容易地在一個地方共享他們的數據集,并使其他科學家能夠輕松訪問這些數據以增強他們的研究。我們還確保MaveDB可以“與其他數據庫對話”以增加協(xié)作。對于不斷增長的MAVE研究領域來說,通過確保數據的可用性,數據庫是邁向開放科學和可重復性的重要一步。"
從MAVE獲得的數據有許多應用,包括了解基因或蛋白質的功能,測量遺傳變異在疾病中的參與程度,或了解如何使合成蛋白質(如生物技術中使用的蛋白質)更有效。
視覺數據
除了建立MaveDB,該團隊還開發(fā)了一個名為MaveVis的數據可視化軟件,使研究人員更容易理解和解釋MAVED實驗的結果。
Rubin博士說:“Mavevis提供了MaveVis數據的即時和一致顯示,包括有價值的注釋(如蛋白質結構信息),這將加速協(xié)作研究?!?
“我們設想,隨著MaveDB在生物信息學領域的廣泛應用,還會增加其他應用,這將為可視化和解釋復雜的基因組學數據提供新的方法——從而帶來新的發(fā)現,以增強生物醫(yī)學研究。這可能會支持新藥的開發(fā),或者理解患者的基因組變異是如何導致疾病的?!?
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯系刪除!