研究人員利用人工智能技術證明,所謂的“垃圾”DNA突變會導致自閉癥。這項研究發(fā)表在5月27日的《自然遺傳學》上,是第一項將這種突變與神經(jīng)發(fā)育聯(lián)系起來的研究。
這項研究由奧爾加特羅揚斯卡婭和羅伯特達內(nèi)爾合作領導。Troyanskaya是紐約市計算生物學教授(CCB)和普林斯頓大學計算機科學系鐵研究所中心基因組學副主任。達內(nèi)爾是洛克菲勒大學癌癥生物學的羅伯特和哈麗特海勒布倫教授,也是霍華德休斯醫(yī)學研究所的研究員。
他們的團隊使用機器學習分析了1790名自閉癥患者及其未受影響的父母和兄弟姐妹的整個基因組。這些人沒有自閉癥家族史,這意味著他們患病的遺傳原因可能是自發(fā)突變,而不是基因突變。
這項分析預測了基因組中不編碼蛋白質(zhì)的基因突變分支,這些區(qū)域經(jīng)常被誤認為是“垃圾”DNA。與非編碼突變相關的自閉癥病例數(shù)等于與使基因功能喪失的蛋白質(zhì)編碼突變相關的病例數(shù)。
特羅亞斯卡婭說,這項工作的意義不僅僅是自閉癥?!斑@是首次明確證實非遺傳非編碼突變會導致任何復雜的人類疾病或紊亂?!?
該報告的共同作者、普林斯頓大學的CCB和Jian Zhou表示,科學家可以應用新研究中使用的相同技術,探索非編碼突變在癌癥和心臟病等疾病中的作用?!斑@讓人們對自閉癥的成因有了新的認識,不僅是自閉癥,還有很多人類疾病?!?
只有1%到2%的人類基因組由編碼蛋白質(zhì)藍圖的基因組成。這些蛋白質(zhì)在我們體內(nèi)執(zhí)行任務,如調(diào)節(jié)血糖水平、對抗感染和發(fā)送細胞間的通信。然而,我們基因組的另外98%并不是死重量。非編碼區(qū)有助于調(diào)節(jié)基因何時何地產(chǎn)生蛋白質(zhì)。
在沒有自閉癥家族史的個體中,蛋白質(zhì)編碼區(qū)的突變占自閉癥病例的30%。證據(jù)表明,導致自閉癥的突變也一定發(fā)生在基因組的其他地方。
很難揭示哪些非編碼突變可能導致自閉癥。單個個體可能有幾十個非編碼突變,其中大多數(shù)是個體獨有的。這使得識別受影響人群中常見突變的傳統(tǒng)方法變得不可能。
特羅亞斯卡婭和她的同事采取了一種新的方法。他們訓練機器學習模型來預測給定序列將如何影響基因表達。
普林斯頓Troyanskaya實驗室的研究科學家Chandra Theesfeld說:“這是我們在分析中引入的基因研究理念的改變?!薄俺搜芯看笕簜€體的常見基因突變的科學家,我們在這里還應用了一套智能而復雜的工具,告訴我們?nèi)魏翁囟ǖ耐蛔儠l(fā)生什么,甚至是那些罕見的或以前從未觀察到的突變?!?
研究人員通過將機器學習模型應用于名為西蒙斯單純形集合的遺傳數(shù)據(jù)寶庫來研究自閉癥的遺傳基礎。西蒙斯基金會,鐵研究所的母組織,是生產(chǎn)和維護的倉庫。Ons Simplex Collection包含了近2000個“四重奏”的全基因組,由自閉癥兒童、未受影響的兄弟姐妹及其未受影響的父母組成。
這四個群體過去沒有自閉癥家族史,這意味著非遺傳性突變可能是患病兒童患病的原因。(這種突變在精子、卵子和胚胎中自發(fā)發(fā)生。)
研究人員使用他們的模型來預測每個自閉癥兒童的非遺傳非編碼突變的影響。然后,他們將這些預測與兒童未受影響的兄弟姐妹中相同的、未改變的鏈條的影響進行比較。
“西蒙斯單純形集合的設計使我們能夠進行這項研究,”周說。"未受影響的兄弟姐妹是一種內(nèi)在的控制力。"
分析表明,自閉癥兒童的許多非編碼突變改變了基因調(diào)控。此外,研究結果表明,突變會影響大腦中的基因表達和已經(jīng)與自閉癥相關的基因,例如負責神經(jīng)元遷移和發(fā)育的基因?!斑@與大腦中最有可能的自閉癥表現(xiàn)相一致,”建行研究科學家、該研究的合著者克里斯托弗帕克(Christopher Park)說?!斑@不僅僅是突變的數(shù)量,而是發(fā)生了什么樣的突變?!?
研究人員在實驗室實驗中測試了一些非編碼突變的影響。他們將自閉癥兒童中發(fā)現(xiàn)的預測高影響突變插入細胞,并觀察基因表達的變化。這些變化證實了模型的預測。
Troyanskaya說,她和她的同事將繼續(xù)改進和擴展他們的方法。最后,她希望這項工作能夠改善基因數(shù)據(jù)如何被用來診斷和治療疾病?!艾F(xiàn)在,98%的基因組通常都被扔掉了,”她說?!拔覀兊墓ぷ骺梢宰屇闼伎?8%我們能做什么?!?
標簽:
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關。財經(jīng)信息僅供讀者參考,并不構成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權請聯(lián)系刪除!