由 ICREA 研究員 Patrick Aloy 博士領(lǐng)導(dǎo)的結(jié)構(gòu)生物信息學(xué)和網(wǎng)絡(luò)生物學(xué)實驗室已經(jīng)使用深度機(jī)器學(xué)習(xí)計算模型完成了 100 萬個分子的生物活性信息。它還公開了一種工具來預(yù)測任何分子的生物活性,即使沒有可用的實驗數(shù)據(jù)。
這種新方法基于化學(xué)檢查器,這是迄今為止最大的偽藥物生物活性概況數(shù)據(jù)庫,由同一實驗室開發(fā)并于 2020 年發(fā)布?;瘜W(xué)檢查器從每個分子的 25 個生物活性空間收集信息。這些空間與分子的化學(xué)結(jié)構(gòu)、與其相互作用的靶標(biāo)或其在臨床或細(xì)胞水平上引起的變化有關(guān)。然而,對于大多數(shù)分子來說,這種關(guān)于作用機(jī)制的高度詳細(xì)的信息是不完整的,這意味著對于特定的分子,可能有關(guān)于一兩個生物活性空間的信息,但不是所有 25 個空間的信息。
借助這一新進(jìn)展,研究人員將所有可用的實驗信息與深度機(jī)器學(xué)習(xí)方法相結(jié)合,從而可以完成所有分子的所有活動概況,從化學(xué)到臨床水平。
“新工具還使我們能夠預(yù)測新分子的生物活性空間,這在藥物發(fā)現(xiàn)過程中至關(guān)重要,因為我們可以選擇最合適的候選物并丟棄那些由于某種原因而不起作用的候選物,”解釋說阿洛伊博士。
該軟件庫可供科學(xué)界在 bioactivitysignatures.org 上免費訪問,隨著更多生物活性數(shù)據(jù)的可用,研究人員將定期更新該軟件庫。隨著 Chemical Checker 中實驗數(shù)據(jù)的每次更新,人工神經(jīng)網(wǎng)絡(luò)也將被修改以完善估計。
預(yù)測和可靠性
模型預(yù)測的生物活性數(shù)據(jù)具有或多或少的可靠性取決于各種因素,包括可用的實驗數(shù)據(jù)量和分子的特性。
除了在生物水平上預(yù)測活動的各個方面之外,Aloy 博士團(tuán)隊開發(fā)的系統(tǒng)還提供了對每個分子預(yù)測的可靠性程度的衡量標(biāo)準(zhǔn)。“所有模型都是錯誤的,但有些模型是有用的!置信度的測量使我們能夠更好地解釋結(jié)果并突出分子的哪些生物活性空間是準(zhǔn)確的,哪些空間可以考慮錯誤率,”Martino Bertoni 博士解釋說,該作品的第一作者。
標(biāo)簽: 生物活性
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!