霽彩華年,因夢(mèng)同行—— 慶祝深圳霽因生物醫(yī)藥轉(zhuǎn)化研究院成立十周年 情緒益生菌PS128助力孤獨(dú)癥治療,權(quán)威研究顯示可顯著改善孤獨(dú)癥癥狀 PARP抑制劑氟唑帕利助力患者從維持治療中獲益,改寫晚期卵巢癌治療格局 新東方智慧教育發(fā)布“東方創(chuàng)科人工智能開發(fā)板2.0” 精準(zhǔn)血型 守護(hù)生命 腸道超聲可用于檢測(cè)兒童炎癥性腸病 迷走神經(jīng)刺激對(duì)抑郁癥有積極治療作用 探索梅尼埃病中 MRI 描述符的性能和最佳組合 自閉癥患者中癡呆癥的患病率增加 超聲波 3D 打印輔助神經(jīng)源性膀胱的骶神經(jīng)調(diào)節(jié) 胃食管反流病患者耳鳴風(fēng)險(xiǎn)增加 間質(zhì)性膀胱炎和膀胱疼痛綜合征的臨床表現(xiàn)不同 研究表明 多語言能力可提高自閉癥兒童的認(rèn)知能力 科學(xué)家揭示人類與小鼠在主要癌癥免疫治療靶點(diǎn)上的驚人差異 利用正確的成像標(biāo)準(zhǔn)改善對(duì)腦癌結(jié)果的預(yù)測(cè) 地中海飲食通過腸道細(xì)菌變化改善記憶力 讓你在 2025 年更健康的 7 種驚人方法 為什么有些人的頭發(fā)和指甲比其他人長(zhǎng)得快 物質(zhì)的使用會(huì)改變大腦的結(jié)構(gòu)嗎 飲酒如何影響你的健康 20個(gè)月,3大平臺(tái),300倍!元育生物以全左旋蝦青素引領(lǐng)合成生物新紀(jì)元 從技術(shù)困局到創(chuàng)新錨點(diǎn),天與帶來了一場(chǎng)屬于養(yǎng)老的“情緒共振” “華潤(rùn)系”大動(dòng)作落槌!昆藥集團(tuán)完成收購(gòu)華潤(rùn)圣火 十七載“冬至滋補(bǔ)節(jié)”,東阿阿膠將品牌營(yíng)銷推向新高峰 150個(gè)國(guó)家承認(rèn)巴勒斯坦國(guó)意味著什么 中國(guó)海警對(duì)非法闖仁愛礁海域菲船只采取管制措施 國(guó)家四級(jí)救災(zāi)應(yīng)急響應(yīng)啟動(dòng) 涉及福建、廣東 女生查分查出608分后,上演取得理想成績(jī)“三件套” 多吃紅色的櫻桃能補(bǔ)鐵、補(bǔ)血? 中國(guó)代表三次回?fù)裘婪焦糁肛?zé) 探索精神健康前沿|情緒益生菌PS128閃耀寧波醫(yī)學(xué)盛會(huì),彰顯科研實(shí)力 圣美生物:以科技之光,引領(lǐng)肺癌早篩早診新時(shí)代 神經(jīng)干細(xì)胞移植有望治療慢性脊髓損傷 一種簡(jiǎn)單的血漿生物標(biāo)志物可以預(yù)測(cè)患有肥胖癥青少年的肝纖維化 嬰兒的心跳可能是他們說出第一句話的關(guān)鍵 研究發(fā)現(xiàn)基因檢測(cè)正成為主流 血液測(cè)試顯示心臟存在排斥風(fēng)險(xiǎn) 無需提供組織樣本 假體材料有助于減少靜脈導(dǎo)管感染 研究發(fā)現(xiàn)團(tuán)隊(duì)運(yùn)動(dòng)對(duì)孩子的大腦有很大幫助 研究人員開發(fā)出診斷 治療心肌炎的決策途徑 兩項(xiàng)研究評(píng)估了醫(yī)療保健領(lǐng)域人工智能工具的發(fā)展 利用女子籃球隊(duì)探索足部生物力學(xué) 抑制前列腺癌細(xì)胞:雄激素受體可以改變前列腺的正常生長(zhǎng) 肽抗原上的反應(yīng)性半胱氨酸可能開啟新的癌癥免疫治療可能性 研究人員發(fā)現(xiàn)新基因療法可以緩解慢性疼痛 研究人員揭示 tisa-cel 療法治療復(fù)發(fā)或難治性 B 細(xì)胞淋巴瘤的風(fēng)險(xiǎn) 適量飲酒可降低高危人群罹患嚴(yán)重心血管疾病的風(fēng)險(xiǎn) STIF科創(chuàng)節(jié)揭曉獎(jiǎng)項(xiàng),新東方智慧教育榮膺雙料殊榮 中科美菱發(fā)布2025年產(chǎn)品戰(zhàn)略布局!技術(shù)方向支撐產(chǎn)品生態(tài)縱深! 從雪域高原到用戶口碑 —— 復(fù)方塞隆膠囊的品質(zhì)之旅
您的位置:首頁(yè) >國(guó)外科研 >

以最少的編碼對(duì)生物序列進(jìn)行簡(jiǎn)單的一體化分析 設(shè)計(jì)和解釋

由于測(cè)序技術(shù)成本的下降和可用計(jì)算能力的增加,如今科學(xué)家生成的數(shù)據(jù)量非常龐大。但是解析所有這些數(shù)據(jù)以發(fā)現(xiàn)有用的信息就像在大海撈針中尋找分子針一樣。

機(jī)器學(xué)習(xí)(ML)和其他人工智能(AI)工具可以顯著加快數(shù)據(jù)分析過程,但大多數(shù)ML工具對(duì)于非ML專家來說很難訪問和使用。最近,開發(fā)了自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)方法,可以自動(dòng)設(shè)計(jì)和部署ML工具,但它們通常非常復(fù)雜,并且需要ML的設(shè)施,而AI領(lǐng)域以外的科學(xué)家很少有這種設(shè)施。

哈佛大學(xué)和麻省理工學(xué)院Wyss生物啟發(fā)工程研究所的一組科學(xué)家現(xiàn)在通過構(gòu)建一個(gè)新的、全面的AutoML平臺(tái)來滿足這一未滿足的需求,該平臺(tái)專為幾乎沒有ML經(jīng)驗(yàn)的生物學(xué)家設(shè)計(jì)。他們的平臺(tái)稱為BioAutoMATED,可以使用核酸、肽或聚糖序列作為輸入數(shù)據(jù),其性能可與其他AutoML平臺(tái)相媲美,同時(shí)需要最少的用戶輸入。該平臺(tái)在CellSystems上發(fā)表的一篇新論文中有所描述,可從GitHub下載。

“我們的工具適用于那些無法構(gòu)建自己的自定義ML模型的人,他們發(fā)現(xiàn)自己會(huì)問這樣的問題,“我有這個(gè)很酷的數(shù)據(jù)集,ML是否適用于它?如何將其放入ML模型中?機(jī)器學(xué)習(xí)的復(fù)雜性阻礙了我進(jìn)一步研究這個(gè)數(shù)據(jù)集,那么我該如何克服它呢?'”D.“我們想讓其他領(lǐng)域的生物學(xué)家和專家更容易地使用ML和AutoML的強(qiáng)大功能來回答基本問題,并幫助發(fā)現(xiàn)有意義的生物學(xué)。”

面向所有人的AutoML

像許多偉大的想法一樣,成為BioAutoMATED的種子不是在實(shí)驗(yàn)室里種下的,而是在午餐時(shí)種下的。Valeri和共同第一作者LuisSoenksen博士和KatieCollins在WyssInstitute的一張餐桌上一起吃飯時(shí),他們意識(shí)到盡管該研究所享有世界級(jí)生物研究目的地的聲譽(yù),但只有少數(shù)在那里工作的頂級(jí)專家能夠構(gòu)建和訓(xùn)練ML模型可以大大有利于他們的工作。

Soenksen說:“我們決定我們需要為此做點(diǎn)什么,因?yàn)槲覀兿M鸚yss處于人工智能生物技術(shù)革命的前沿,我們也希望這些工具的開發(fā)由生物學(xué)家推動(dòng),為生物學(xué)家服務(wù)。”WyssInstitute的博士后研究員,也是科技領(lǐng)域的連續(xù)創(chuàng)業(yè)者。“現(xiàn)在,每個(gè)人都同意人工智能是未來,但四年前當(dāng)我們有了這個(gè)想法時(shí),它并不是那么明顯,特別是對(duì)于生物研究。所以,它開始作為我們想要構(gòu)建的工具來服務(wù)我們自己和我們的Wyss同事,但現(xiàn)在我們知道它可以提供更多服務(wù)。”

雖然已經(jīng)開發(fā)了各種AutoML系統(tǒng)來簡(jiǎn)化從數(shù)據(jù)集生成ML模型的過程,但它們通常都有缺點(diǎn);其中,每個(gè)AutoML工具都被設(shè)計(jì)為在搜索最佳解決方案時(shí)僅查看一種類型的模型(例如,神經(jīng)網(wǎng)絡(luò))。這將生成的模型限制在一組狹窄的可能性中,而實(shí)際上,完全不同類型的模型可能更優(yōu)化。另一個(gè)問題是,大多數(shù)AutoML工具并不是專門為將生物序列作為輸入數(shù)據(jù)而設(shè)計(jì)的。已經(jīng)開發(fā)了一些使用語言模型來分析生物序列的工具,但這些工具缺乏自動(dòng)化功能并且難以使用。

為了為生物學(xué)構(gòu)建一個(gè)強(qiáng)大的一體式AutoML,該團(tuán)隊(duì)修改了三個(gè)現(xiàn)有的AutoML工具,每個(gè)工具都使用不同的方法來生成模型:AutoKeras,用于搜索最佳神經(jīng)網(wǎng)絡(luò);DeepSwarm,它使用基于群體的算法來搜索卷積神經(jīng)網(wǎng)絡(luò);和TPOT,它使用多種方法搜索非神經(jīng)網(wǎng)絡(luò),包括遺傳編程和自學(xué)習(xí)。BioAutoMATED然后為所有三種工具生成標(biāo)準(zhǔn)化的輸出結(jié)果,以便用戶可以輕松地比較它們并確定哪種類型從他們的數(shù)據(jù)中產(chǎn)生最有用的見解。

該團(tuán)隊(duì)構(gòu)建的BioAutoMATED能夠?qū)⑷魏伍L(zhǎng)度、類型或生物功能的DNA、RNA、氨基酸和聚糖(在細(xì)胞表面發(fā)現(xiàn)的糖分子)序列作為輸入。BioAutoMATED自動(dòng)預(yù)處理輸入數(shù)據(jù),然后生成可以僅根據(jù)序列信息預(yù)測(cè)生物學(xué)功能的模型。

該平臺(tái)還具有許多功能,可幫助用戶確定他們是否需要收集額外數(shù)據(jù)以提高輸出質(zhì)量,了解模型最“關(guān)注”序列的哪些特征(因此可能更具生物學(xué)意義),并為未來的實(shí)驗(yàn)設(shè)計(jì)新的序列。

核苷酸和肽和聚糖

為了測(cè)試他們的新框架,該團(tuán)隊(duì)首先使用它來探索改變一段稱為核糖體結(jié)合位點(diǎn)(RBS)的RNA序列如何影響核糖體與RNA結(jié)合并將其轉(zhuǎn)化為蛋白質(zhì)的效率大腸桿菌。他們將序列數(shù)據(jù)輸入BioAutoMATED,BioAutoMATED確定了一個(gè)由DeepSwarm算法生成的模型,該模型可以準(zhǔn)確預(yù)測(cè)翻譯效率。

該模型的性能與專業(yè)ML專家創(chuàng)建的模型一樣好,但生成時(shí)間僅為26.5分鐘,并且只需要用戶輸入10行代碼(其他模型可能需要750多行)。他們還使用BioAutoMATED來確定序列的哪些區(qū)域似乎對(duì)確定翻譯效率最重要,并設(shè)計(jì)可以通過實(shí)驗(yàn)測(cè)試的新序列。

然后他們繼續(xù)試驗(yàn)將肽和聚糖序列數(shù)據(jù)輸入BioAutoMATED,并使用結(jié)果來回答有關(guān)這些序列的特定問題。該系統(tǒng)生成了關(guān)于肽序列中的哪些氨基酸對(duì)于確定抗體與藥物雷珠單抗(Lucentis)結(jié)合的能力最重要的高度準(zhǔn)確的信息,并且還根據(jù)其序列將不同類型的聚糖分為免疫原性和非免疫原性組.該團(tuán)隊(duì)還使用它來優(yōu)化基于RNA的腳趾開關(guān)的序列,為新的腳趾開關(guān)的設(shè)計(jì)提供信息,用于實(shí)驗(yàn)測(cè)試,用戶的輸入編碼最少。

“最終,我們能夠證明BioAutoMATED可以幫助人們1)識(shí)別生物數(shù)據(jù)中的模式,2)就該數(shù)據(jù)提出更好的問題,以及3)快速回答這些問題,所有這些都在一個(gè)框架內(nèi)進(jìn)行——無需成為ML專家自己,”凱蒂柯林斯說,她目前是劍橋大學(xué)的研究生,在麻省理工學(xué)院攻讀本科期間從事該項(xiàng)目。

與任何其他ML工具一樣,任何借助BioAutoMATED預(yù)測(cè)的模型都需要盡可能在實(shí)驗(yàn)室中進(jìn)行實(shí)驗(yàn)驗(yàn)證。但該團(tuán)隊(duì)希望它可以進(jìn)一步集成到不斷增長(zhǎng)的AutoML工具集中,有朝一日將其功能擴(kuò)展到生物序列之外的任何類似序列的對(duì)象,例如指紋。

“機(jī)器學(xué)習(xí)和人工智能工具已經(jīng)存在了一段時(shí)間,但只是隨著最近用戶友好界面的發(fā)展,它們才開始流行起來,就像ChatGPT一樣,”JimCollins說,他也是麻省理工學(xué)院醫(yī)學(xué)工程與科學(xué)Termeer教授。“我們希望BioAutoMATED能夠讓下一代生物學(xué)家更快、更容易地發(fā)現(xiàn)生命的基礎(chǔ)。”

“使非專家能夠使用這些平臺(tái)對(duì)于能夠利用ML技術(shù)的全部潛力來解決生物學(xué)及其他領(lǐng)域長(zhǎng)期存在的問題至關(guān)重要??铝炙箞F(tuán)隊(duì)的這一進(jìn)步是使AI成為關(guān)鍵合作者的重要一步對(duì)于生物學(xué)家和生物工程師來說,”Wyss創(chuàng)始董事DonIngber博士說,他也是哈佛醫(yī)學(xué)院和波士頓兒童醫(yī)院的JudahFolkman血管生物學(xué)教授,以及HansjörgWyss生物啟發(fā)工程教授哈佛大學(xué)JohnA.Paulson工程與應(yīng)用科學(xué)學(xué)院(SEAS)。

標(biāo)簽:

免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章