021年7 月 7 日——根據(jù)最近發(fā)表在美國國家科學(xué)院院刊上的一項研究結(jié)果,先進機器學(xué)習(xí)軟件的使用已導(dǎo)致識別出數(shù)百個可能影響工作免疫系統(tǒng)的新基因。美利堅合眾國。
正向遺傳學(xué)是反向工作的過程,從表型(通常由隨機種系誘變劑誘導(dǎo))開始,到致病突變的發(fā)現(xiàn)結(jié)束。傳統(tǒng)上,篩選中檢測到的突變表型與特定突變之間的聯(lián)系是通過自動減數(shù)分裂映射 (AMM) 實現(xiàn)的,其中統(tǒng)計概率暗示了因果關(guān)系。然而,這并不是因果關(guān)系的唯一指標。
許多其他因素會影響正確選擇真正的致病突變,包括:
突變的性質(zhì)(良性、破壞性、無效)
斷奶前基因生存的必要性
測試的純合子數(shù)量和表型效應(yīng)的大小
相關(guān)屏幕的數(shù)據(jù)差異特征
由突變引起的不同表型的數(shù)量
共分離突變的存在與否
其他具有類似作用的等位基因的觀察
在目前的研究中,由諾貝爾獎獲得者、宿主防御遺傳學(xué)中心 (CGHD) 主任 Bruce Beutler 博士領(lǐng)導(dǎo)的德克薩斯大學(xué)西南大學(xué)的一個研究小組設(shè)定了使用人工智能準確推斷種系突變是特定表型的原因。
該團隊開發(fā)了 Candidate Explorer (CE),這是一種機器學(xué)習(xí)算法,將遺傳圖譜數(shù)據(jù)的 67 個特征整合到一個單一的數(shù)字分數(shù)中,在數(shù)學(xué)上可轉(zhuǎn)換為任何假定的突變表型關(guān)聯(lián)的驗證概率。軟件考慮的輸入特征包括表型數(shù)據(jù)(來自篩選)、突變數(shù)據(jù)、基因數(shù)據(jù)和減數(shù)分裂映射數(shù)據(jù)。
Beutler 解釋說,這項工作是近十年前開始的一項研究計劃的一部分,旨在識別可能影響小鼠免疫系統(tǒng)的每個突變。根據(jù)當前研究的結(jié)果,該程序已被用于篩選超過 55% 的小鼠基因,以了解對血液中免疫細胞流式細胞術(shù)測量的影響。
“CE 的目的是幫助研究人員預(yù)測與表型(性狀或功能)相關(guān)的突變是否是真正的致病突變,”Beutler 說。“CE 已經(jīng)幫助我們鑒定了數(shù)百個在免疫中具有新功能的基因。這將提高我們對免疫系統(tǒng)的理解,以便我們能夠找到保持其強大的新方法,并了解它有時會出現(xiàn)問題的原因。”
該研究側(cè)重于免疫細胞群的變化,特別是 B 細胞、T 細胞、樹突狀細胞 (DC)、巨噬細胞、中性粒細胞、NK 細胞和 NK1.1+T 細胞。通過對來自突變小鼠的外周血白細胞的流式細胞術(shù)分析來檢測和測量所有細胞群和亞群。
Candidate Explorer 成功評估了大約 87,000 個突變/表型關(guān)聯(lián),這些關(guān)聯(lián)是通過循環(huán)免疫細胞的流式細胞術(shù)篩選確定的。從這些關(guān)聯(lián)中,該軟件區(qū)分了代表 2,336 個突變的 1,279 個基因,這些基因被評為良好或優(yōu)秀的表型因果候選者。
數(shù)據(jù)表明,影響血液中免疫細胞群的大多數(shù)基因執(zhí)行細胞類型或表型特異性功能。68% 的基因只有 1、2 或 3 個良好或極好的表型關(guān)聯(lián),而只有 23% 的基因具有超過 20 個良好或極好的關(guān)聯(lián)(許多被確定為眾所周知的免疫調(diào)節(jié)基因),這證明了這一點。 )。
此外,已知或預(yù)測對生存能力至關(guān)重要的 449 個基因 (35%) 與至少一種流式細胞術(shù)表型相關(guān),表明許多對發(fā)育重要的基因可能在成年白細胞中也具有功能。
有趣的是,科學(xué)家們發(fā)現(xiàn),良好或優(yōu)良基因關(guān)聯(lián)的數(shù)量因受影響的細胞類型而異。通常,B 細胞和 T 細胞表型與大多數(shù)基因相關(guān),而 DC 表型與極少數(shù)基因相關(guān)。
研究人員還確定了代表“新”免疫學(xué)重要基因的 386 個基因。對于這些基因中的許多基因,以前沒有主要的免疫學(xué)或其他表型數(shù)據(jù)可用。
這些數(shù)據(jù)將有助于小鼠遺傳學(xué)家識別數(shù)量性狀基因座內(nèi)的致病突變,而臨床遺傳學(xué)家可以使用 Candidate Explorer 幫助將致病變異與罕見的遺傳性免疫疾病聯(lián)系起來,即使在沒有連鎖信息的情況下。通過這種方式,該軟件可能會促進和加速對全基因組關(guān)聯(lián)研究發(fā)現(xiàn)的疾病相關(guān)基因座內(nèi)的因果變異的識別。
“我們現(xiàn)在已經(jīng)研究了大約 60% 的基因組,并確定了數(shù)千個基因——其中數(shù)百個是新基因——它們參與了小鼠的免疫,” Beutler 評論道。“其中絕大多數(shù)也有助于人類免疫力。”
小鼠和人類基因組在基因的大小和含量上非常相似。
“幾乎所有的小鼠基因都有人類對應(yīng)物,反之亦然,” Beutler 解釋說。
標簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!