一個國際研究小組生成了第一個真正完整的人類 Y 染色體序列,這是最終被完全測序的人類染色體。新序列填補了 Y 染色體長度 50% 以上的空白,揭示了對生育力有影響的重要基因組特征,例如精子產生的因素。這項研究由端粒到端粒 (T2T) 聯盟領導,該聯盟是由國立衛(wèi)生研究院下屬的國家人類基因組研究所 (NHGRI) 資助的一個研究小組,今天發(fā)表在《自然》雜志上。
Y 染色體和 X 染色體經常因其在性發(fā)育中的作用而被討論。雖然這些染色體發(fā)揮著核心作用,但與人類性發(fā)育有關的因素遍布整個基因組,而且非常復雜,從而產生了男性、女性和雙性個體中發(fā)現的一系列人類性別特征。這些類別并不等同于性別,性別是一個社會類別。此外,最近的研究表明,Y 染色體上的基因有助于人類生物學的其他方面,例如癌癥風險和嚴重程度。
20 年前,當研究人員完成第一個人類基因組測序時,所有 24 條染色體的序列都留下了缺口。然而,與基因組序列其余部分散布的小缺口(T2T 聯盟去年填補的缺口)不同,Y 染色體序列的一半以上仍然是個謎。
所有染色體都有一些重復區(qū)域,但 Y 染色體異常重復,使其序列特別難以完成。組裝測序數據就像嘗試閱讀一本被切成條的長書。如果書中的所有行都是唯一的,則更容易確定行的順序。但是,如果同一個句子重復數千或數百萬次,則條帶的原始順序就不太清楚了。雖然所有人類染色體都含有重復序列,但 Y 染色體上約有 3000 萬個字母是重復序列。就好像這本書的一半長度都重復了同樣的幾句話。
為了解決人類基因組中最重復的片段,T2T 聯盟應用了新的 DNA 測序技術和序列組裝方法,以及從為其他 23 條人類染色體生成第一個無間隙序列中獲得的知識。
“最令人驚訝的是重復的組織方式,”NHGRI 的高級研究員兼該聯盟的領導者 Adam Phillippy 博士說。“我們不知道缺失的序列到底是什么組成的。它可能非?;靵y,但相反,近一半的染色體是由兩個稱為衛(wèi)星 DNA 的特定重復序列的交替塊組成的。它形成了美麗的、像被子一樣的圖案。”
完整的 Y 染色體序列還揭示了醫(yī)學相關區(qū)域的重要特征。Y 染色體的一個這樣的部分被稱為無精子癥因子區(qū)域,這是一段 DNA,包含幾個已知與精子產生有關的基因。利用新完成的序列,研究人員研究了無精子因子區(qū)域中一組反向重復或“回文”的結構。
NHGRI 科學家、 《自然》雜志的第一作者 Arang Rhie 博士說:“這種結構非常重要,因為這些回文有時會產生 DNA 環(huán)。” “有時,這些環(huán)會意外被切斷并在基因組中產生缺失。”
眾所周知,無精子癥因子區(qū)域的缺失會破壞精子的產生,因此這些回文可能會影響生育能力。有了完整的 Y 染色體序列,研究人員現在可以更精確地分析這些缺失及其對精子產生的影響。
其他具有潛在醫(yī)學相關性的區(qū)域包含重復的基因。人類基因組中的大多數基因都有兩個拷貝,每個拷貝都遺傳自父母。然而,一些基因有許多沿著 DNA 片段重復的拷貝,有時被稱為“基因陣列”。
研究人員重點關注了TSPY,這是另一種被認為與精子生成有關的基因。TSPY的拷貝被組織在人類基因組中第的基因陣列中。與其他重復區(qū)域一樣,重復基因的分析具有挑戰(zhàn)性,因此雖然已知TSPY存在許多重復拷貝,但該陣列的具體 DNA 序列和組織結構以前是未知的。當研究人員分析這個區(qū)域時,他們發(fā)現不同的個體含有 10 到 40 個TSPY拷貝。
“當你發(fā)現以前從未見過的變異時,我們總是希望這些基因組變異對于了解人類健康非常重要,”菲利普博士說。“醫(yī)學相關的基因組變異可以幫助我們在未來設計更好的診斷方法。”
除了完整的 Y 染色體序列外,NHGRI 資助的人類基因組結構變異聯盟還報告了 43 條不同人類 Y 染色體的序列,該序列也在今天發(fā)表在同一期《自然》雜志上。這些進展補充了 T2T 聯盟于 2022 年發(fā)布的無間隙人類基因組序列,以及NHGRI 資助的人類泛基因組參考聯盟于 2023 年 5 月發(fā)布的“泛基因組” 。 通過這些成就,科學家們可以獲得豐富的新基因組學資源來解開人類生物學的謎團,并為基因組醫(yī)學的未來鋪平道路。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯系刪除!