宏基因組學通常涉及對只能被描述為“棘手”的 DNA 樣本進行測序。這種 DNA 顯示出高度的異質性,這會導致種間錯誤組裝。這些錯誤組裝威脅到宏基因組測序的目的,即通過在給定樣本中生成多個基因組草圖來全面研究基因庫。由于這些樣本中存在某些無法使用標準微生物學技術進行培養(yǎng)的生物,這個問題變得更加復雜。如何解決這一系列問題?
東京工業(yè)大學的科學家現(xiàn)在有了答案。他們開發(fā)了一種名為 MetaPlatanus 的新型宏基因組組裝器,它可以生成準確的 DNA 序列,包括未培養(yǎng)生物的 DNA 序列。他們的突破性發(fā)現(xiàn)已作為研究文章發(fā)表在Nucleic Acids Research 上。
MetaPlatanus 使用準確的短 DNA 序列讀取來組裝重疊群。Contigs 是一段稍長的 DNA 序列,類似于較大基因組中的拼圖。通過重復使用諸如長距離序列鏈接、物種特異性序列組成、覆蓋深度和分箱信息等輸入,重疊群被組裝成更大的染色體尺度支架。
東京工業(yè)大學生命科學與技術學院助理教授、該研究的首席科學家 Rei Kajitani 博士解釋了基于 MetaPlatanus 的支架生成的輸入選擇,他說:“我們采用混合宏基因組組裝方法,不僅利用了短程和長程序列讀取的優(yōu)點,而且彌補了讀取長度和樣本本身帶來的缺點。”
他進一步補充說:“我們已經(jīng)將分箱應用于由難以組裝的區(qū)域(例如重復區(qū)域)劃分的鏈接序列。我們的方法是新穎的,因為到目前為止,分箱和組裝過程的組合尚未作為公共工具實施!”
Kajitani 博士和他的團隊不遺余力地檢查 MetaPlatanus 生成的結果的準確性。在這方面,他們使用已知細菌的模擬數(shù)據(jù)集執(zhí)行了一個稱為基準測試的過程。毫不奇怪,MetaPlatanus 給出了高度連續(xù)的輸出,很少有種間錯誤組裝。
值得注意的是,在使用已發(fā)表的人類腸道數(shù)據(jù)測試 MetaPlatanus 的準確性時,它還組裝了許多生物學上重要的元素,包括編碼基因、基因簇、病毒序列和過半細菌基因組。
此外,與其他現(xiàn)有工具相比,只有 MetaPlatanus 能夠對一些高豐度細菌基因組進行近乎完整的組裝,同時使用已發(fā)布的人類唾液數(shù)據(jù)進行基準測試。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!