這項(xiàng)新研究的作者分析的癌癥 DNA 片段源自人類基因組,其序列源自數(shù)百萬年的進(jìn)化,并通過“復(fù)制-粘貼-編輯”過程以及與寄生蟲的共同進(jìn)化形成。元素。例如,我們 8% 的 DNA 來自過去的病毒感染。
塑造我們基因組的曲折突變過程在癌細(xì)胞基因組中加劇并危及生命,導(dǎo)致無政府狀態(tài)的細(xì)胞突變和增殖。
我們基因組中重復(fù)的 DNA 序列不僅是我們過去進(jìn)化的化石,而且還記錄了癌癥如何進(jìn)化,這有助于科學(xué)家了解和研究癌癥的發(fā)展和進(jìn)展。當(dāng)前的技術(shù)允許科學(xué)家閱讀并拼湊數(shù)十億個短 DNA 序列,以研究癌癥基因組并識別其中的突變。但是,人類基因組的一個基本特征阻礙了這種對重復(fù) DNA 的探索:如何將通常從同一祖先副本粘貼的短的準(zhǔn)相同序列替換回它們的原始基因組位置?以及如何識別這些序列中的突變?
最近發(fā)表在 Nature Biotechnology 上的文章利用人工智能的力量來解決這個問題。將這種新穎的工具應(yīng)用于迄今為止最大的原發(fā)性癌癥基因組集合,已經(jīng)產(chǎn)生了有趣的發(fā)現(xiàn)。例如,即使在眾所周知的癌癥基因的編碼序列中也發(fā)現(xiàn)了用普通工具無法檢測到的突變。這意味著攜帶這些突變的癌癥患者可能會受益于針對這些基因的治療。在沿著人類基因組重復(fù)多次的基因家族中發(fā)現(xiàn)了其他突變。其中一些家族已經(jīng)與癌癥有關(guān),但無法觀察到它們的突變。作者已將這一豐富的資源提供給科學(xué)界,這進(jìn)一步豐富了癌癥基因組學(xué)的金礦。
Maxime Tarabichi 及其合作者開發(fā)的算法不僅限于癌癥,也不限于人類基因組。它是使用當(dāng)前測序技術(shù)生成數(shù)據(jù)的通用工具,全世界所有研究生命進(jìn)化的科學(xué)家都可以使用它。
標(biāo)簽: 人工智能
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!