冷泉港實驗室的定量生物學家大衛(wèi)麥坎德利斯(David McCandlish)和周娟楠(Juannan Zhou)開發(fā)了一種預測算法,這種算法使科學家能夠看到特定的基因突變如何結合起來改變一個物種進化中的關鍵蛋白質。
《自然通訊》中描述的算法被稱為“最小上插值法”,可以直觀地顯示蛋白質是如何進化成高效或根本無效的。他們比較了成千上萬種蛋白質的功能,發(fā)現了這種突變是如何導致蛋白質從一種功能形式進化到另一種功能形式的。
“癲癇癥”描述的是基因突變之間的任何相互作用,其中一個基因的功能依賴于另一個基因的存在。在許多情況下,科學家認為,當現實與他們的預測模型不一致時,基因之間的這些相互作用將發(fā)揮作用??紤]到這一點,麥坎德利斯基于每個突變都很重要的假設,創(chuàng)建了這個新算法。術語“內插”描述了預測物種中可能實現最佳蛋白質功能的突變的進化路徑的行為。
研究人員通過測試構成鏈球菌GB1蛋白的基因中特定突變的影響來創(chuàng)建該算法。他們選擇GB1蛋白是因為其結構復雜,會產生大量可能的突變,可以通過多種可能的方式結合。
“由于這種復雜性,這個數據集的可視化變得非常重要,”麥坎德利斯說?!拔覀兿氚褦底肿兂蓤D片,這樣我們就能更好地理解(數據)告訴我們的東西?!?
可視化就像拓撲圖。圖上兩點之間的距離代表了突變發(fā)展到蛋白質活性水平需要多長時間。
GB1蛋白具有來自自然界的中等水平的蛋白質活性,但它可能通過幾個不同位置的一系列突變進化為更高水平的蛋白質活性。
麥坎德利斯將蛋白質的進化路徑比作徒步旅行,在徒步旅行中,蛋白質是一種試圖最有效地到達最高或最好的山峰的徒步旅行者?;蛞酝瑯拥姆绞竭M化:尋求通過突變來最小化抗性和提高效率的方法。
為了到達山脈的下一個最高峰,徒步旅行者更有可能沿著山脊線旅行,而不是一路走回山谷。沿著山脊線,有效地避免了另一個可能困難的上升過程。在可視化中,山谷是藍色區(qū)域,在那里突變的組合導致最低水平的蛋白質活性。
該算法顯示了每個可能突變序列的最佳程度,以及遺傳序列突變成許多其他可能序列所需的時間。就新冠而言,這一工具的預測能力可能特別有價值。研究人員需要知道病毒的發(fā)展,以便在病毒達到最危險的形式之前知道在哪里和什么時候攔截它。
McCandlish解釋說,該算法還可以幫助“理解病毒在進化過程中可能采取的遺傳途徑,以逃避免疫系統(tǒng)或獲得耐藥性。如果我們能理解可能的方法,那么也許我們可以設計一種可以阻止進化的治療方法。或者免疫逃逸。”
這種預測遺傳算法還有其他潛在的應用,包括藥物開發(fā)和農業(yè)。
“你知道,在遺傳學開始的時候.所有關于這些基因空間的有趣猜測,如果你真的能看到它們,會是什么樣子,”mccandless補充道?!艾F在我們真的做到了!這真的很酷。”
標簽:
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據此操作,風險自擔。 如有侵權請聯系刪除!