德克薩斯大學(xué)MD安德森癌癥中心的研究人員已經(jīng)開發(fā)出了首創(chuàng)的基于人工智能(AI)的工具,該工具可以從單細(xì)胞數(shù)據(jù)集中準(zhǔn)確地識別出罕見的重要生物學(xué)重要細(xì)胞群,這些細(xì)胞通常包含基因或蛋白質(zhì)表達(dá)來自數(shù)千個細(xì)胞的數(shù)據(jù)。該研究今天發(fā)表在《自然計(jì)算科學(xué)》上。
該計(jì)算工具稱為SCMER(單細(xì)胞流形保留特征選擇),可以幫助研究人員對復(fù)雜數(shù)據(jù)集的噪聲進(jìn)行分類,以研究否則可能無法識別的細(xì)胞。
高級作者,生物信息學(xué)與計(jì)算生物學(xué)副教授Ken Chen博士解釋說,SCMER可能廣泛應(yīng)用于腫瘤學(xué)及其他領(lǐng)域,包括對最小殘留疾病,耐藥性和免疫細(xì)胞群的研究。
Chen說:“現(xiàn)代技術(shù)可以產(chǎn)生大量數(shù)據(jù),但要確定哪些基因或蛋白質(zhì)在那些情況下實(shí)際上很重要變得越來越困難。”“例如,小細(xì)胞群可能具有可能在耐藥性中起作用的重要特征,但是這些特征可能不足以將它們與更常見的細(xì)胞區(qū)分開。在分析單細(xì)胞數(shù)據(jù)集以使其能夠檢測這些稀有細(xì)胞及其獨(dú)特的分子特征。”
在癌癥研究中開發(fā)有效研究小型或稀有細(xì)胞種群的方法,是對國家癌癥研究所(NCI)在2020年提出的挑釁性問題之一的直接回應(yīng),該問題被指定為一個重要且尚未開發(fā)的研究領(lǐng)域。SCMER旨在解決此問題,并使研究人員能夠從日益復(fù)雜的數(shù)據(jù)集中獲得最大收益。
與基于數(shù)據(jù)集中包含的所有數(shù)據(jù)將細(xì)胞分類為簇的傳統(tǒng)方法不同,SCMER采取無偏見的方式來檢測定義唯一細(xì)胞組的最有意義的區(qū)別特征。這使研究人員不僅可以檢測稀有細(xì)胞群,還可以生成一組緊湊的基因或蛋白質(zhì),可用于檢測許多其他細(xì)胞。為了突出SCMER的實(shí)用性,研究團(tuán)隊(duì)將其應(yīng)用到分析了多個已發(fā)布的單細(xì)胞數(shù)據(jù)集,發(fā)現(xiàn)它與當(dāng)前可用的計(jì)算方法相比具有優(yōu)勢。
在對超過4,500個黑色素瘤細(xì)胞的重新分析中,SCMER能夠僅使用75個基因的表達(dá)來區(qū)分存在的細(xì)胞類型。結(jié)果還指出了許多與腫瘤發(fā)展和耐藥有關(guān)的基因,在原始研究中沒有被認(rèn)為是有意義的。
在包含近40,000個胃腸道免疫細(xì)胞的復(fù)雜數(shù)據(jù)集中,SCMER僅使用250個不同的特征來分離細(xì)胞。該分析確定了在原始研究中檢測到的所有原始細(xì)胞類型,但在許多情況下,進(jìn)一步定義了以前未鑒定的稀有細(xì)胞亞組。
最后,研究小組應(yīng)用SCMER研究了藥物治療后各個時間點(diǎn)采集的1,400多種肺癌細(xì)胞。該工具僅使用80個基因,即可根據(jù)治療反應(yīng)準(zhǔn)確區(qū)分細(xì)胞,并指出了治療耐藥性的新驅(qū)動力。
標(biāo)簽: AI
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!