物質(zhì)中電子的排列(稱為電子結(jié)構(gòu))在藥物設(shè)計(jì)和能量存儲(chǔ)等基礎(chǔ)研究和應(yīng)用研究中發(fā)揮著至關(guān)重要的作用。然而,缺乏在不同時(shí)間和長(zhǎng)度尺度上提供高保真度和可擴(kuò)展性的模擬技術(shù)長(zhǎng)期以來一直是這些技術(shù)進(jìn)步的障礙。
德國格爾利茨亥姆霍茲德累斯頓-羅森多夫中心(HZDR)高級(jí)系統(tǒng)理解中心(CASUS)和美國新墨西哥州阿爾伯克基桑迪亞國家實(shí)驗(yàn)室的研究人員現(xiàn)已開創(chuàng)了一種基于機(jī)器學(xué)習(xí)的模擬方法取代傳統(tǒng)的電子結(jié)構(gòu)仿真技術(shù)。
他們的材料學(xué)習(xí)算法(MALA)軟件堆棧可以訪問以前無法實(shí)現(xiàn)的長(zhǎng)度尺度。該工作發(fā)表在《npj計(jì)算材料》雜志上。
電子是具有根本重要性的基本粒子。它們之間以及與原子核之間的量子力學(xué)相互作用產(chǎn)生了化學(xué)和材料科學(xué)中觀察到的多種現(xiàn)象。了解和控制物質(zhì)的電子結(jié)構(gòu)可以深入了解分子的反應(yīng)性、行星內(nèi)的結(jié)構(gòu)和能量傳輸以及材料失效的機(jī)制。
科學(xué)挑戰(zhàn)越來越多地通過計(jì)算建模和模擬、利用高性能計(jì)算的能力來解決。然而,實(shí)現(xiàn)具有量子精度的真實(shí)模擬的一個(gè)重大障礙是缺乏將高精度與跨不同長(zhǎng)度和時(shí)間尺度的可擴(kuò)展性結(jié)合起來的預(yù)測(cè)建模技術(shù)。
經(jīng)典原子模擬方法可以處理大型復(fù)雜系統(tǒng),但其對(duì)量子電子結(jié)構(gòu)的省略限制了其適用性。相反,不依賴于經(jīng)驗(yàn)建模和參數(shù)擬合(第一原理方法)等假設(shè)的模擬方法提供了高保真度,但計(jì)算要求較高。例如,密度泛函理論(DFT)是一種廣泛使用的第一原理方法,它表現(xiàn)出隨系統(tǒng)尺寸的三次縮放,從而將其預(yù)測(cè)能力限制在小尺度上。
基于深度學(xué)習(xí)的混合方法
研究人員團(tuán)隊(duì)現(xiàn)在提出了一種新穎的模擬方法,稱為材料學(xué)習(xí)算法(MALA)軟件堆棧。在計(jì)算機(jī)科學(xué)中,軟件堆棧是算法和軟件組件的集合,它們組合在一起創(chuàng)建用于解決特定問題的軟件應(yīng)用程序。
倫茨·費(fèi)德勒博士CASUS的學(xué)生和MALA的主要開發(fā)人員解釋說:“MALA將機(jī)器學(xué)習(xí)與基于物理的方法相結(jié)合來預(yù)測(cè)材料的電子結(jié)構(gòu)。它采用了一種混合方法,利用一種稱為深度學(xué)習(xí)的既定機(jī)器學(xué)習(xí)方法來準(zhǔn)確預(yù)測(cè)局部量,并輔以用于計(jì)算感興趣的全局量的物理算法。”
MALA軟件堆棧將空間中原子的排列作為輸入,并生成稱為雙譜分量的指紋,對(duì)笛卡爾網(wǎng)格點(diǎn)周圍原子的空間排列進(jìn)行編碼。MALA中的機(jī)器學(xué)習(xí)模型經(jīng)過訓(xùn)練,可以根據(jù)該原子鄰域預(yù)測(cè)電子結(jié)構(gòu)。MALA的一個(gè)顯著優(yōu)勢(shì)是其機(jī)器學(xué)習(xí)模型能夠獨(dú)立于系統(tǒng)規(guī)模,使其能夠根據(jù)小型系統(tǒng)的數(shù)據(jù)進(jìn)行訓(xùn)練并以任何規(guī)模進(jìn)行部署。
研究小組在其出版物中展示了這一策略的顯著有效性。與傳統(tǒng)算法相比,對(duì)于由多達(dá)數(shù)千個(gè)原子組成的較小系統(tǒng)規(guī)模,他們實(shí)現(xiàn)了1,000倍以上的加速。此外,該團(tuán)隊(duì)還證明了MALA能夠準(zhǔn)確執(zhí)行大規(guī)模電子結(jié)構(gòu)計(jì)算,涉及超過100,000個(gè)原子。值得注意的是,這一成就是通過適度的計(jì)算工作實(shí)現(xiàn)的,揭示了傳統(tǒng)DFT代碼的局限性。
CASUS極端條件下物質(zhì)部門代理系主任AttilaCangi解釋道:“隨著系統(tǒng)規(guī)模的增大和涉及的原子數(shù)量的增加,DFT計(jì)算變得不切實(shí)際,而MALA的速度優(yōu)勢(shì)不斷增強(qiáng)。MALA的關(guān)鍵突破在于其“能夠在本地原子環(huán)境中運(yùn)行,從而實(shí)現(xiàn)精確的數(shù)值預(yù)測(cè),并且受系統(tǒng)尺寸的影響最小。這一突破性的成就開啟了曾經(jīng)被認(rèn)為無法實(shí)現(xiàn)的計(jì)算可能性。”
預(yù)計(jì)將推動(dòng)應(yīng)用研究
Cangi旨在利用機(jī)器學(xué)習(xí)突破電子結(jié)構(gòu)計(jì)算的界限。“我們預(yù)計(jì)MALA將引發(fā)電子結(jié)構(gòu)計(jì)算的變革,因?yàn)槲覀儸F(xiàn)在有一種方法可以以前所未有的速度模擬更大的系統(tǒng)。未來,研究人員將能夠基于顯著的計(jì)算能力解決廣泛的社會(huì)挑戰(zhàn)。改善基線,包括開發(fā)新疫苗和新型儲(chǔ)能材料、對(duì)半導(dǎo)體器件進(jìn)行大規(guī)模模擬、研究材料缺陷以及探索將大氣溫室氣體二氧化碳轉(zhuǎn)化為氣候友好礦物質(zhì)的化學(xué)反應(yīng)。”
此外,MALA的方法特別適合高性能計(jì)算(HPC)。隨著系統(tǒng)規(guī)模的增長(zhǎng),MALA可以在其使用的計(jì)算網(wǎng)格上進(jìn)行獨(dú)立處理,從而有效地利用HPC資源,特別是圖形處理單元。
桑迪亞國家實(shí)驗(yàn)室的科學(xué)家兼并行計(jì)算專家SivaRajamanickam解釋說:“MALA的電子結(jié)構(gòu)計(jì)算算法很好地映射到具有分布式加速器的現(xiàn)代HPC系統(tǒng)。分解工作并跨不同網(wǎng)格點(diǎn)并行執(zhí)行的能力加速器使MALA成為HPC資源上可擴(kuò)展機(jī)器學(xué)習(xí)的理想選擇,從而在電子結(jié)構(gòu)計(jì)算中實(shí)現(xiàn)無與倫比的速度和效率。”
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!