宏基因組學(xué)通常涉及對只能被描述為“棘手”的 DNA 樣本進行測序。這種 DNA 顯示出高度的異質(zhì)性,這會導(dǎo)致種間錯誤組裝。這些錯誤組裝威脅到宏基因組測序的目的,即通過在給定樣本中生成多個基因組草圖來全面研究基因庫。由于這些樣本中存在某些無法使用標(biāo)準(zhǔn)微生物學(xué)技術(shù)進行培養(yǎng)的生物,這個問題變得更加復(fù)雜。如何解決這一系列問題?
東京工業(yè)大學(xué)的科學(xué)家現(xiàn)在有了答案。他們開發(fā)了一種名為 MetaPlatanus 的新型宏基因組組裝器,它可以生成準(zhǔn)確的 DNA 序列,包括未培養(yǎng)生物的 DNA 序列。他們的突破性發(fā)現(xiàn)已作為研究文章發(fā)表在Nucleic Acids Research 上。
MetaPlatanus 使用準(zhǔn)確的短 DNA 序列讀取來組裝重疊群。Contigs 是一段稍長的 DNA 序列,類似于較大基因組中的拼圖。通過重復(fù)使用諸如長距離序列鏈接、物種特異性序列組成、覆蓋深度和分箱信息等輸入,重疊群被組裝成更大的染色體尺度支架。
東京工業(yè)大學(xué)生命科學(xué)與技術(shù)學(xué)院助理教授、該研究的首席科學(xué)家 Rei Kajitani 博士解釋了基于 MetaPlatanus 的支架生成的輸入選擇,他說:“我們采用混合宏基因組組裝方法,不僅利用了短程和長程序列讀取的優(yōu)點,而且彌補了讀取長度和樣本本身帶來的缺點。”
他進一步補充說:“我們已經(jīng)將分箱應(yīng)用于由難以組裝的區(qū)域(例如重復(fù)區(qū)域)劃分的鏈接序列。我們的方法是新穎的,因為到目前為止,分箱和組裝過程的組合尚未作為公共工具實施!”
Kajitani 博士和他的團隊不遺余力地檢查 MetaPlatanus 生成的結(jié)果的準(zhǔn)確性。在這方面,他們使用已知細(xì)菌的模擬數(shù)據(jù)集執(zhí)行了一個稱為基準(zhǔn)測試的過程。毫不奇怪,MetaPlatanus 給出了高度連續(xù)的輸出,很少有種間錯誤組裝。
值得注意的是,在使用已發(fā)表的人類腸道數(shù)據(jù)測試 MetaPlatanus 的準(zhǔn)確性時,它還組裝了許多生物學(xué)上重要的元素,包括編碼基因、基因簇、病毒序列和過半細(xì)菌基因組。
此外,與其他現(xiàn)有工具相比,只有 MetaPlatanus 能夠?qū)σ恍└哓S度細(xì)菌基因組進行近乎完整的組裝,同時使用已發(fā)布的人類唾液數(shù)據(jù)進行基準(zhǔn)測試。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!