卡內(nèi)基梅隆大學(xué)計算生物學(xué)系和俄羅斯圣彼得堡州立大學(xué)的研究人員設(shè)計的一種算法可以幫助科學(xué)家識別未知分子。該算法名為 MolDiscovery,它使用來自分子的質(zhì)譜數(shù)據(jù)來預(yù)測未知物質(zhì)的身份,在研究早期告訴科學(xué)家他們是偶然發(fā)現(xiàn)了新事物,還是僅僅重新發(fā)現(xiàn)了已知事物。
這一發(fā)展可以節(jié)省尋找可用于醫(yī)學(xué)的新天然產(chǎn)品的時間和金錢。
“科學(xué)家們浪費了大量時間來分離已知的分子,基本上是重新發(fā)現(xiàn)青霉素,”助理教授、研究團隊成員 Hosein Mohimani 說。“早期檢測分子是否已知可以節(jié)省時間和數(shù)百萬美元,并有望使制藥公司和研究人員更好地尋找可能導(dǎo)致新藥開發(fā)的新型天然產(chǎn)品。”
該團隊的工作“MolDiscovery:學(xué)習(xí)小分子的質(zhì)譜碎片化”最近發(fā)表在《自然通訊》上。研究團隊包括 Mohimani;CMU博士學(xué)生劉曹和穆斯塔法·古勒;CMU研究助理李奕元;以及圣彼得堡州立大學(xué)算法生物技術(shù)中心的研究人員 Azat Tagirdzhanov 和 Alexey Gurevich。
Mohimani 在代謝組學(xué)和宏基因組學(xué)實驗室的研究重點是尋找新的天然藥物,例如,在一位科學(xué)家檢測到一種有望作為海洋或土壤樣本中潛在藥物的分子后,可能需要一年時間或更長的時間來識別分子,但不能保證該物質(zhì)是新的。MolDiscovery 使用質(zhì)譜測量和預(yù)測性機器學(xué)習(xí)模型來快速準確地識別分子。
質(zhì)譜測量是分子的指紋,但與指紋不同的是,沒有龐大的數(shù)據(jù)庫來匹配它們。盡管已經(jīng)發(fā)現(xiàn)了數(shù)十萬種天然分子,但科學(xué)家們無法獲得他們的質(zhì)譜數(shù)據(jù)。MolDiscovery 從質(zhì)譜數(shù)據(jù)中預(yù)測分子的身份,而無需依賴質(zhì)譜數(shù)據(jù)庫進行匹配。
該團隊希望 MolDiscovery 將成為實驗室發(fā)現(xiàn)新型天然產(chǎn)物的有用工具。MolDiscovery 可以與 Mohimani 實驗室開發(fā)的機器學(xué)習(xí)平臺 NRPminer 協(xié)同工作,幫助科學(xué)家分離天然產(chǎn)物。與 NRPminer 相關(guān)的研究最近也發(fā)表在Nature Communications 上。
標簽: 分子
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!