研究人員挖掘了一個(gè)數(shù)據(jù)庫(kù),其中包含幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)——使用Google DeepMind 革命性的 AlphaFold 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)了超過(guò) 2 億條條目。這項(xiàng)工作揭示了全新的形狀、生命機(jī)器中令人驚訝的聯(lián)系,以及幾年前無(wú)法想象的其他見(jiàn)解。
首爾國(guó)立大學(xué)的計(jì)算生物學(xué)家 Martin Steinegger 表示,科學(xué)家們立即發(fā)現(xiàn)該資源很方便,但他們中的許多人只關(guān)注單個(gè)結(jié)構(gòu)或相關(guān)結(jié)構(gòu)家族,他對(duì)繪制整個(gè)數(shù)據(jù)庫(kù)的關(guān)系感興趣。“我認(rèn)為看看我們的結(jié)構(gòu)宇宙到底有多大會(huì)很有趣。”
為此,由 Steinegger 和瑞士蘇黎世聯(lián)邦理工學(xué)院計(jì)算生物學(xué)家 Pedro Beltrao 共同領(lǐng)導(dǎo)的團(tuán)隊(duì)開發(fā)了一種工具,可以根據(jù)形狀的相似性快速比較數(shù)據(jù)庫(kù)中的每個(gè)結(jié)構(gòu)。這在 AlphaFold 數(shù)據(jù)庫(kù)1中識(shí)別出了超過(guò) 200 萬(wàn)個(gè)形狀相似的蛋白質(zhì)“簇” 。
研究人員通常使用基因編碼的蛋白質(zhì)序列進(jìn)行此類比較。但與它們的結(jié)構(gòu)相比,蛋白質(zhì)序列在進(jìn)化過(guò)程中往往變化得更快,限制了尋找關(guān)系極遠(yuǎn)的蛋白質(zhì)的能力。Steinegger 估計(jì),通過(guò)比較蛋白質(zhì)結(jié)構(gòu),他們識(shí)別出的相關(guān)蛋白質(zhì)簇的數(shù)量是僅使用序列時(shí)的 10 倍。
研究人員才剛剛開始探索蛋白質(zhì)宇宙中這些新發(fā)現(xiàn)的“星系”,但他們已經(jīng)發(fā)現(xiàn)了一些令人驚訝的聯(lián)系。例如,他們發(fā)現(xiàn)人類和其他復(fù)雜生物體用來(lái)檢測(cè)病毒 DNA 并引發(fā)快速免疫攻擊的一種蛋白質(zhì)與來(lái)自單細(xì)胞細(xì)菌和古細(xì)菌的蛋白質(zhì)處于一個(gè)簇中——這種聯(lián)系以前并不為人所知,斯坦尼格說(shuō)。
對(duì)于超過(guò)三分之一的蛋白質(zhì)簇幾乎一無(wú)所知。“我真的希望生物學(xué)家能夠?yàn)檫@個(gè)黑暗帶來(lái)一些曙光,”斯坦格說(shuō)。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!