123,123

深度學(xué)習(xí)是人工智能的一種形式，它通過教導(dǎo)計(jì)算機(jī)使用模仿人腦的人工神經(jīng)網(wǎng)絡(luò)來處理信息，從而改變社會(huì)。它現(xiàn)在被用于面部識別、自動(dòng)駕駛汽車，甚至用于玩圍棋等復(fù)雜游戲。一般來說，深度學(xué)習(xí)的成功取決于使用大型標(biāo)記圖像數(shù)據(jù)集進(jìn)行訓(xùn)練。

科學(xué)文獻(xiàn)中蘊(yùn)藏著潛在的標(biāo)記圖像金礦，每年發(fā)表超過一百萬篇文章。大多數(shù)文本中都融入了許多圖形。迄今為止，這些數(shù)字尚不適合深度學(xué)習(xí)模型。這在一定程度上是由于其復(fù)雜的布局造成的。每個(gè)圖形通常包含多個(gè)嵌入的圖像、圖表和插圖。還缺乏在文獻(xiàn)中搜索與特定內(nèi)容匹配的圖像的適當(dāng)方法。

為了應(yīng)對這一挑戰(zhàn)，美國能源部 (DOE) 阿貢國家實(shí)驗(yàn)室和西北大學(xué)的研究人員創(chuàng)建了 EXSCLAIM!軟件工具。該名稱代表圖像的提取、分離和基于標(biāo)題的自然語言注釋。

研究結(jié)果發(fā)表在《模式》雜志上。

“電子顯微鏡產(chǎn)生的十億分之一米的圖像是材料科學(xué)文獻(xiàn)中最重要的圖像之一，”阿貢納米材料中心(美國能源部科學(xué)辦公室用戶設(shè)施)的科學(xué)家瑪麗亞·陳(Maria Chan)說。 “這些圖像對于理解和開發(fā)許多不同領(lǐng)域的新材料至關(guān)重要。我們 EXSCLAIM! 的目標(biāo)是釋放這些成像數(shù)據(jù)的未開發(fā)潛力。”

什么設(shè)置 EXSCLAIM!其獨(dú)特之處在于它對數(shù)據(jù)集查詢方法的獨(dú)特關(guān)注，類似于 ChatGPT 和 DALL-E 等生成式 AI 工具中提示的使用方式。因此，它能夠從圖形中提取具有非常具體內(nèi)容的單個(gè)圖像，因?yàn)樗瓤梢詫D像內(nèi)容進(jìn)行分類，又可以識別放大程度。然后它可以為每個(gè)圖像創(chuàng)建描述性標(biāo)簽。這種創(chuàng)新的軟件工具有望成為研究納米級新材料的科學(xué)家的寶貴資產(chǎn)。

“雖然現(xiàn)有的方法常常難以解決復(fù)合布局問題，但 EXSCLAIM! 采用了一種新方法來克服這個(gè)問題，”主要作者、前阿貢國家實(shí)驗(yàn)室研究生 Eric Sc??hwenker 說。 “我們的軟件能夠有效識別清晰的圖像邊界，并且擅長捕捉不規(guī)則的圖像排列。”

標(biāo)簽：

免責(zé)聲明：本文由用戶上傳，與本網(wǎng)站立場無關(guān)。財(cái)經(jīng)信息僅供讀者參考，并不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。如有侵權(quán)請聯(lián)系刪除！

新代碼挖掘科學(xué)文章中的顯微鏡圖像

猜你喜歡

最新文章