123,123

導(dǎo)讀研究人員挖掘了一個數(shù)據(jù)庫，其中包含幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)——使用Google DeepMind 革命性的 AlphaFold 神經(jīng)網(wǎng)絡(luò)預(yù)測了超過 2 億...

研究人員挖掘了一個數(shù)據(jù)庫，其中包含幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)——使用Google DeepMind 革命性的 AlphaFold 神經(jīng)網(wǎng)絡(luò)預(yù)測了超過 2 億條條目。這項(xiàng)工作揭示了全新的形狀、生命機(jī)器中令人驚訝的聯(lián)系，以及幾年前無法想象的其他見解。

首爾國立大學(xué)的計(jì)算生物學(xué)家 Martin Steinegger 表示，科學(xué)家們立即發(fā)現(xiàn)該資源很方便，但他們中的許多人只關(guān)注單個結(jié)構(gòu)或相關(guān)結(jié)構(gòu)家族，他對繪制整個數(shù)據(jù)庫的關(guān)系感興趣。“我認(rèn)為看看我們的結(jié)構(gòu)宇宙到底有多大會很有趣。”

為此，由 Steinegger 和瑞士蘇黎世聯(lián)邦理工學(xué)院計(jì)算生物學(xué)家 Pedro Beltrao 共同領(lǐng)導(dǎo)的團(tuán)隊(duì)開發(fā)了一種工具，可以根據(jù)形狀的相似性快速比較數(shù)據(jù)庫中的每個結(jié)構(gòu)。這在 AlphaFold 數(shù)據(jù)庫1中識別出了超過 200 萬個形狀相似的蛋白質(zhì)“簇” 。

研究人員通常使用基因編碼的蛋白質(zhì)序列進(jìn)行此類比較。但與它們的結(jié)構(gòu)相比，蛋白質(zhì)序列在進(jìn)化過程中往往變化得更快，限制了尋找關(guān)系極遠(yuǎn)的蛋白質(zhì)的能力。Steinegger 估計(jì)，通過比較蛋白質(zhì)結(jié)構(gòu)，他們識別出的相關(guān)蛋白質(zhì)簇的數(shù)量是僅使用序列時(shí)的 10 倍。

研究人員才剛剛開始探索蛋白質(zhì)宇宙中這些新發(fā)現(xiàn)的“星系”，但他們已經(jīng)發(fā)現(xiàn)了一些令人驚訝的聯(lián)系。例如，他們發(fā)現(xiàn)人類和其他復(fù)雜生物體用來檢測病毒 DNA 并引發(fā)快速免疫攻擊的一種蛋白質(zhì)與來自單細(xì)胞細(xì)菌和古細(xì)菌的蛋白質(zhì)處于一個簇中——這種聯(lián)系以前并不為人所知，斯坦尼格說。

對于超過三分之一的蛋白質(zhì)簇幾乎一無所知。“我真的希望生物學(xué)家能夠?yàn)檫@個黑暗帶來一些曙光，”斯坦格說。

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，如有侵權(quán)請聯(lián)系刪除！

蛋白質(zhì)結(jié)構(gòu)家族圖譜讓科學(xué)家們興奮不已

猜你喜歡

最新文章