癌細胞與健康細胞有何不同?一種名為“ikarus”的新機器學習算法知道答案,由 MDC 生物信息學家 Altuna Akalin 領導的團隊在《基因組生物學》雜志上報道。人工智能程序發(fā)現了腫瘤的基因特征。
在識別海量數據中的模式時,人類無法與人工智能 (AI) 匹敵。特別是,稱為機器學習的 AI 分支通常用于查找數據集中的規(guī)律性——無論是用于股票市場分析、圖像和語音識別,還是用于細胞分類。為了可靠地區(qū)分癌細胞和健康細胞,由亥姆霍茲協(xié)會 (MDC) Max Delbrück 分子醫(yī)學中心生物信息學和組學數據科學平臺負責人 Altuna Akalin 博士領導的團隊現已開發(fā)出機器學習程序稱為“伊卡魯斯”。
該程序在腫瘤細胞中發(fā)現了一種模式,這種模式對不同類型的癌癥很常見,由基因的特征組合組成。根據該團隊在《基因組生物學》雜志上的論文,該算法還檢測到這種模式中以前從未與癌癥明確相關的基因類型。
機器學習本質上意味著算法使用訓練數據來學習如何自己回答某些問題。它通過在數據中搜索有助于解決問題的模式來做到這一點。在訓練階段之后,系統(tǒng)可以從它所學的知識中進行概括,以評估未知數據。“在專家已經清楚地區(qū)分‘健康’和‘癌細胞’細胞的情況下,獲得合適的訓練數據是一項重大挑戰(zhàn),”該論文的第一作者 Jan Dohmen 說道。
驚人的成功率
此外,單細胞測序數據集通常很嘈雜。這意味著它們包含的有關單個細胞的分子特征的信息不是很精確——可能是因為在每個細胞中檢測到的基因數量不同,或者因為樣品的處理方式并不總是相同。正如 Dohmen 和他的同事、該研究的聯(lián)合負責人 Vedran Franke 博士所報告的那樣,他們篩選了無數出版物并聯(lián)系了相當多的研究小組,以獲得足夠的數據集。該團隊最終使用來自肺癌和結直腸癌細胞的數據來訓練算法,然后將其應用于其他類型腫瘤的數據集。
在訓練階段,ikarus 必須找到一個特征基因列表,然后將其用于對細胞進行分類。“我們嘗試并改進了各種方法,”Dohmen 說。正如三位科學家所說,這是一項耗時的工作。“關鍵是ikarus最終使用兩個列表:一個用于癌癥基因,另一個用于來自其他細胞的基因,”弗蘭克解釋道。在學習階段之后,該算法也能夠可靠地區(qū)分其他類型癌癥(例如組織樣本)中的健康細胞和腫瘤細胞來自肝癌或神經母細胞瘤患者。它的成功率往往非常高,這甚至讓研究小組感到驚訝。“我們沒想到會有一個共同的特征可以如此精確地定義不同類型癌癥的腫瘤細胞,”Akalin 說。“但我們仍然不能說這種方法是否適用于所有類型的癌癥,”Dohmen 補充道。為了將 ikarus 變成一種可靠的癌癥診斷工具,研究人員現在想要在其他類型的腫瘤上進行測試。
標簽:
免責聲明:本文由用戶上傳,與本網站立場無關。財經信息僅供讀者參考,并不構成投資建議。投資者據此操作,風險自擔。 如有侵權請聯(lián)系刪除!