研究人員挖掘了一個數(shù)據(jù)庫,其中包含幾乎所有已知蛋白質的結構——使用Google DeepMind 革命性的 AlphaFold 神經(jīng)網(wǎng)絡預測了超過 2 億條條目。這項工作揭示了全新的形狀、生命機器中令人驚訝的聯(lián)系,以及幾年前無法想象的其他見解。
首爾國立大學的計算生物學家 Martin Steinegger 表示,科學家們立即發(fā)現(xiàn)該資源很方便,但他們中的許多人只關注單個結構或相關結構家族,他對繪制整個數(shù)據(jù)庫的關系感興趣。“我認為看看我們的結構宇宙到底有多大會很有趣。”
為此,由 Steinegger 和瑞士蘇黎世聯(lián)邦理工學院計算生物學家 Pedro Beltrao 共同領導的團隊開發(fā)了一種工具,可以根據(jù)形狀的相似性快速比較數(shù)據(jù)庫中的每個結構。這在 AlphaFold 數(shù)據(jù)庫1中識別出了超過 200 萬個形狀相似的蛋白質“簇” 。
研究人員通常使用基因編碼的蛋白質序列進行此類比較。但與它們的結構相比,蛋白質序列在進化過程中往往變化得更快,限制了尋找關系極遠的蛋白質的能力。Steinegger 估計,通過比較蛋白質結構,他們識別出的相關蛋白質簇的數(shù)量是僅使用序列時的 10 倍。
研究人員才剛剛開始探索蛋白質宇宙中這些新發(fā)現(xiàn)的“星系”,但他們已經(jīng)發(fā)現(xiàn)了一些令人驚訝的聯(lián)系。例如,他們發(fā)現(xiàn)人類和其他復雜生物體用來檢測病毒 DNA 并引發(fā)快速免疫攻擊的一種蛋白質與來自單細胞細菌和古細菌的蛋白質處于一個簇中——這種聯(lián)系以前并不為人所知,斯坦尼格說。
對于超過三分之一的蛋白質簇幾乎一無所知。“我真的希望生物學家能夠為這個黑暗帶來一些曙光,”斯坦格說。
標簽:
免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!