冷泉港實(shí)驗(yàn)室的定量生物學(xué)家大衛(wèi)麥坎德利斯(David McCandlish)和周娟楠(Juannan Zhou)開發(fā)了一種預(yù)測(cè)算法,這種算法使科學(xué)家能夠看到特定的基因突變?nèi)绾谓Y(jié)合起來改變一個(gè)物種進(jìn)化中的關(guān)鍵蛋白質(zhì)。
《自然通訊》中描述的算法被稱為“最小上插值法”,可以直觀地顯示蛋白質(zhì)是如何進(jìn)化成高效或根本無效的。他們比較了成千上萬種蛋白質(zhì)的功能,發(fā)現(xiàn)了這種突變是如何導(dǎo)致蛋白質(zhì)從一種功能形式進(jìn)化到另一種功能形式的。
“癲癇癥”描述的是基因突變之間的任何相互作用,其中一個(gè)基因的功能依賴于另一個(gè)基因的存在。在許多情況下,科學(xué)家認(rèn)為,當(dāng)現(xiàn)實(shí)與他們的預(yù)測(cè)模型不一致時(shí),基因之間的這些相互作用將發(fā)揮作用??紤]到這一點(diǎn),麥坎德利斯基于每個(gè)突變都很重要的假設(shè),創(chuàng)建了這個(gè)新算法。術(shù)語“內(nèi)插”描述了預(yù)測(cè)物種中可能實(shí)現(xiàn)最佳蛋白質(zhì)功能的突變的進(jìn)化路徑的行為。
研究人員通過測(cè)試構(gòu)成鏈球菌GB1蛋白的基因中特定突變的影響來創(chuàng)建該算法。他們選擇GB1蛋白是因?yàn)槠浣Y(jié)構(gòu)復(fù)雜,會(huì)產(chǎn)生大量可能的突變,可以通過多種可能的方式結(jié)合。
“由于這種復(fù)雜性,這個(gè)數(shù)據(jù)集的可視化變得非常重要,”麥坎德利斯說?!拔覀兿氚褦?shù)字變成圖片,這樣我們就能更好地理解(數(shù)據(jù))告訴我們的東西。”
可視化就像拓?fù)鋱D。圖上兩點(diǎn)之間的距離代表了突變發(fā)展到蛋白質(zhì)活性水平需要多長(zhǎng)時(shí)間。
GB1蛋白具有來自自然界的中等水平的蛋白質(zhì)活性,但它可能通過幾個(gè)不同位置的一系列突變進(jìn)化為更高水平的蛋白質(zhì)活性。
麥坎德利斯將蛋白質(zhì)的進(jìn)化路徑比作徒步旅行,在徒步旅行中,蛋白質(zhì)是一種試圖最有效地到達(dá)最高或最好的山峰的徒步旅行者?;蛞酝瑯拥姆绞竭M(jìn)化:尋求通過突變來最小化抗性和提高效率的方法。
為了到達(dá)山脈的下一個(gè)最高峰,徒步旅行者更有可能沿著山脊線旅行,而不是一路走回山谷。沿著山脊線,有效地避免了另一個(gè)可能困難的上升過程。在可視化中,山谷是藍(lán)色區(qū)域,在那里突變的組合導(dǎo)致最低水平的蛋白質(zhì)活性。
該算法顯示了每個(gè)可能突變序列的最佳程度,以及遺傳序列突變成許多其他可能序列所需的時(shí)間。就新冠而言,這一工具的預(yù)測(cè)能力可能特別有價(jià)值。研究人員需要知道病毒的發(fā)展,以便在病毒達(dá)到最危險(xiǎn)的形式之前知道在哪里和什么時(shí)候攔截它。
McCandlish解釋說,該算法還可以幫助“理解病毒在進(jìn)化過程中可能采取的遺傳途徑,以逃避免疫系統(tǒng)或獲得耐藥性。如果我們能理解可能的方法,那么也許我們可以設(shè)計(jì)一種可以阻止進(jìn)化的治療方法?;蛘呙庖咛右??!?
這種預(yù)測(cè)遺傳算法還有其他潛在的應(yīng)用,包括藥物開發(fā)和農(nóng)業(yè)。
“你知道,在遺傳學(xué)開始的時(shí)候.所有關(guān)于這些基因空間的有趣猜測(cè),如果你真的能看到它們,會(huì)是什么樣子,”mccandless補(bǔ)充道?!艾F(xiàn)在我們真的做到了!這真的很酷?!?
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!