來(lái)自智利圣地亞哥大學(xué)和圣母大學(xué)的研究人員利用機(jī)器學(xué)習(xí),設(shè)計(jì)了一種基于單一光波長(zhǎng)下的折射率來(lái)識(shí)別有機(jī)化合物的方法。該技術(shù)可以用于自動(dòng)化化學(xué)分析的研究和工業(yè)應(yīng)用,這種分析更便宜、更安全并且需要更少的專業(yè)知識(shí)來(lái)操作。
在發(fā)表于物理化學(xué)雜志A的論文“使用可見光機(jī)器學(xué)習(xí)識(shí)別有機(jī)化合物”中,研究人員記錄了他們獲取獨(dú)特?cái)?shù)據(jù)集的創(chuàng)造性和新穎方式以及他們用于構(gòu)建證明的步驟的概念有機(jī)化學(xué)檢測(cè)器。
機(jī)器學(xué)習(xí)是在一個(gè)公開的過(guò)去光學(xué)實(shí)驗(yàn)數(shù)據(jù)庫(kù)上進(jìn)行訓(xùn)練的,該數(shù)據(jù)庫(kù)包含可追溯到1940年的科學(xué)文獻(xiàn)中的已發(fā)表數(shù)據(jù)。在這個(gè)數(shù)據(jù)庫(kù)中,研究人員找到了編譯61種有機(jī)分子的識(shí)別概況所需的所有參數(shù);群速度和群速度色散、測(cè)量波長(zhǎng)范圍和樣品的物質(zhì)狀態(tài)、寬波長(zhǎng)范圍內(nèi)的折射率和消光系數(shù)??偣矐?yīng)用了61種有機(jī)化合物和聚合物的194,816條折射率和消光曲線光譜記錄。
在典型的紅外(IR)分子分類檢測(cè)器中,分子身份通過(guò)吸收峰和拉曼散射峰確認(rèn),創(chuàng)建與數(shù)據(jù)庫(kù)匹配的組合特征的指紋。有機(jī)化合物的靜態(tài)折射率是一個(gè)單值特征,沒有相同的編碼信息。這同樣適用于遠(yuǎn)離紫外線和紅外線吸收共振的單一波長(zhǎng)的折射率數(shù)據(jù)庫(kù),這也許是可見光未被用于對(duì)有機(jī)分子進(jìn)行分類的原因。
原始數(shù)據(jù)的初始測(cè)試達(dá)到了80%,研究人員試圖從那里提高它。原始數(shù)據(jù)庫(kù)并非旨在優(yōu)化機(jī)器學(xué)習(xí),因?yàn)槠渲写蟛糠謥?lái)自第一臺(tái)家用計(jì)算機(jī)發(fā)明之前進(jìn)行的研究。有大量關(guān)于紫外線和紅外線波長(zhǎng)的信息,AI正在對(duì)這些波長(zhǎng)進(jìn)行交叉訓(xùn)練。因此,研究人員決定采取更有針對(duì)性的方法。
采用了幾種數(shù)據(jù)預(yù)處理策略來(lái)為AI模擬更理想化的學(xué)習(xí)環(huán)境。目標(biāo)是創(chuàng)建一個(gè)平衡的數(shù)據(jù)集,這樣人工智能就不會(huì)僅僅根據(jù)信息量就優(yōu)先考慮某些特征而不是其他特征。過(guò)采樣和欠采樣以及基于物理的數(shù)據(jù)增強(qiáng)技術(shù)用于從根本上減少紅外波長(zhǎng)在整個(gè)數(shù)據(jù)集中的影響。通過(guò)使用經(jīng)過(guò)預(yù)處理的平衡數(shù)據(jù)進(jìn)行訓(xùn)練,研究人員在可見區(qū)域?qū)崿F(xiàn)了超過(guò)98%的分子分類測(cè)試準(zhǔn)確度。
研究人員表示,需要做更多的工作來(lái)擴(kuò)展和推廣分類器,以識(shí)別折射率數(shù)據(jù)庫(kù)中存在的分子的結(jié)構(gòu)和其他化學(xué)特征。總之,他們寫道,這項(xiàng)工作是開發(fā)遠(yuǎn)程化學(xué)傳感器的良好起點(diǎn)。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無(wú)關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!