這種被研究團(tuán)隊(duì)稱為“轉(zhuǎn)化機(jī)器學(xué)習(xí)”(TML)的新方法在解決科學(xué)問(wèn)題(包括藥物設(shè)計(jì))的三個(gè)領(lǐng)域比傳統(tǒng)機(jī)器學(xué)習(xí)做出了更好的預(yù)測(cè)。
“在藥物設(shè)計(jì)中,我們發(fā)現(xiàn) TML 提供了對(duì)藥物靶標(biāo)特異性、藥物之間的關(guān)系以及靶蛋白之間關(guān)系的洞察,”作者寫(xiě)道,由約翰摩爾斯大學(xué)計(jì)算機(jī)科學(xué)與數(shù)學(xué)學(xué)院的 Ivan Olier 領(lǐng)導(dǎo)。英國(guó)
傳統(tǒng)機(jī)器學(xué)習(xí)與 TML
傳統(tǒng)的監(jiān)督 ML 算法在標(biāo)記示例(例如,不同動(dòng)物的標(biāo)記照片)上進(jìn)行訓(xùn)練,從中學(xué)習(xí)識(shí)別內(nèi)在特征(例如,“毛茸茸”和“小”)。相反,TML 依賴于來(lái)自在其他相關(guān)任務(wù)上訓(xùn)練的 ML 模型的預(yù)測(cè)的外在特征。
例如,要訓(xùn)練一個(gè) TML 模型來(lái)識(shí)別所有已知的動(dòng)物物種,并且預(yù)計(jì)會(huì)添加新的動(dòng)物物種,首先要對(duì)已知物種(例如貓、兔子和驢)應(yīng)用現(xiàn)有的預(yù)測(cè)模型。這些模型的輸出將生成新的外在特征,例如“貓性”、“兔子性”和“驢性”,然后將用于訓(xùn)練元級(jí) ML 模型以使用此級(jí)別的表示進(jìn)行預(yù)測(cè)。該方法使 TML 模型能夠捕獲最初未編碼的動(dòng)物的屬性,例如可愛(ài)(貓和兔子共有)和頭部側(cè)面有眼睛(兔子和驢共有)。
“典型的 ML 系統(tǒng)在學(xué)習(xí)識(shí)別一種新型動(dòng)物時(shí)必須從頭開(kāi)始——比如小貓——TML 可以利用與現(xiàn)有動(dòng)物的相似性:小貓像兔子一樣可愛(ài),但沒(méi)有像兔子那樣長(zhǎng)的耳朵兔子和驢,”領(lǐng)導(dǎo)這項(xiàng)研究的劍橋化學(xué)工程和生物技術(shù)系教授羅斯金在一份聲明中說(shuō)。“這使得 TML 成為一種更強(qiáng)大的機(jī)器學(xué)習(xí)方法。”
藥物發(fā)現(xiàn)的承諾
研究人員表示,TML 在藥物發(fā)現(xiàn)領(lǐng)域顯示出特別的前景。典型的 ML 方法將根據(jù)分子形狀和結(jié)構(gòu)等內(nèi)在特征來(lái)搜索藥物分子,而 TML 通過(guò)檢查其他 ML 模型傳達(dá)的有關(guān)特定分子的信息來(lái)加快該過(guò)程。
該論文包括一個(gè)使用 TML 預(yù)測(cè)定量結(jié)構(gòu)活性關(guān)系 (QSAR) 的案例研究,這是早期藥物發(fā)現(xiàn)的一個(gè)常見(jiàn)步驟。給定一個(gè)目標(biāo)(通常是一個(gè)蛋白質(zhì))和一組具有相關(guān)活動(dòng)(例如,抑制目標(biāo)蛋白質(zhì))的化合物(小分子),QSAR 任務(wù)是學(xué)習(xí)從分子表示到活動(dòng)的預(yù)測(cè)映射。在 TML 方法中,基于內(nèi)在描述符的標(biāo)準(zhǔn) ML 方法首先應(yīng)用于現(xiàn)有的 QSAR 預(yù)測(cè)任務(wù),然后將其輸出用作可應(yīng)用于新 QSAR 任務(wù)的新 TML 模型的外在特征。
為了評(píng)估 QSAR 學(xué)習(xí)中的 TML 方法,研究人員使用 1,024 位分子指紋表示作為內(nèi)在特征,針對(duì) 2,219 個(gè) QSAR 問(wèn)題訓(xùn)練了各種 ML 方法。然后,他們使用之前學(xué)習(xí)的 ML 模型預(yù)測(cè)的復(fù)合活動(dòng)作為 TML QSAR 模型的外在屬性。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!