人體由細胞組成這一事實是一個基本的,易于理解的概念。然而令人驚訝的是,科學家們?nèi)栽趪L試確定組成我們的器官并有助于我們健康的各種細胞。
一種稱為單細胞測序的相對較新的技術(shù)使研究人員能夠根據(jù)特征(例如它們表達的基因)來識別和分類細胞類型。但是,這類研究會產(chǎn)生大量數(shù)據(jù),其中包含數(shù)十萬到數(shù)百萬個細胞的數(shù)據(jù)集。
計算醫(yī)學和生物信息學系的Joshua Welch博士開發(fā)了一種新算法。候選人Chao Gao及其團隊使用在線學習,大大加快了這一過程,并為全世界的研究人員提供了一種使用標準便攜式計算機上發(fā)現(xiàn)的內(nèi)存量來分析大型數(shù)據(jù)集的方法。該發(fā)現(xiàn)在《自然生物技術(shù)》雜志上有描述。
我們的技術(shù)使任何擁有計算機的人都可以對整個有機體進行分析。這確實是該領(lǐng)域正在朝著的方向前進。”該團隊使用來自國立衛(wèi)生研究院腦計劃的數(shù)據(jù)集證明了其原理性證明。該計劃旨在通過繪制每個細胞的圖譜來了解人腦,該計劃的研究團隊遍布全國,包括韋爾奇實驗室在內(nèi)。
Welch解釋說,通常,對于像這樣的項目,必須按到達的順序使用先前的數(shù)據(jù)集對提交的每個單單元格數(shù)據(jù)集進行重新分析。他們的新方法允許將新數(shù)據(jù)集添加到現(xiàn)有數(shù)據(jù)集中,而無需重新處理舊數(shù)據(jù)集。它還使研究人員能夠?qū)?shù)據(jù)集分解為所謂的迷你批處理,以減少處理數(shù)據(jù)集所需的內(nèi)存量。
韋爾奇說:“這對于越來越多地生成數(shù)百萬個細胞的集合至關(guān)重要。”“今年,有五到六篇論文具有兩百萬個或更多的單元,而僅用于存儲原始數(shù)據(jù)所需的內(nèi)存量大大超過了他們計算機上的任何人。”
標簽: 細胞數(shù)據(jù)
免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!