物質(zhì)中電子的排列(稱為電子結(jié)構(gòu))在藥物設(shè)計和能量存儲等基礎(chǔ)研究和應(yīng)用研究中發(fā)揮著至關(guān)重要的作用。然而,缺乏在不同時間和長度尺度上提供高保真度和可擴展性的模擬技術(shù)長期以來一直是這些技術(shù)進步的障礙。
德國格爾利茨亥姆霍茲德累斯頓-羅森多夫中心(HZDR)高級系統(tǒng)理解中心(CASUS)和美國新墨西哥州阿爾伯克基桑迪亞國家實驗室的研究人員現(xiàn)已開創(chuàng)了一種基于機器學習的模擬方法取代傳統(tǒng)的電子結(jié)構(gòu)仿真技術(shù)。
他們的材料學習算法(MALA)軟件堆??梢栽L問以前無法實現(xiàn)的長度尺度。該工作發(fā)表在《npj計算材料》雜志上。
電子是具有根本重要性的基本粒子。它們之間以及與原子核之間的量子力學相互作用產(chǎn)生了化學和材料科學中觀察到的多種現(xiàn)象。了解和控制物質(zhì)的電子結(jié)構(gòu)可以深入了解分子的反應(yīng)性、行星內(nèi)的結(jié)構(gòu)和能量傳輸以及材料失效的機制。
科學挑戰(zhàn)越來越多地通過計算建模和模擬、利用高性能計算的能力來解決。然而,實現(xiàn)具有量子精度的真實模擬的一個重大障礙是缺乏將高精度與跨不同長度和時間尺度的可擴展性結(jié)合起來的預(yù)測建模技術(shù)。
經(jīng)典原子模擬方法可以處理大型復(fù)雜系統(tǒng),但其對量子電子結(jié)構(gòu)的省略限制了其適用性。相反,不依賴于經(jīng)驗建模和參數(shù)擬合(第一原理方法)等假設(shè)的模擬方法提供了高保真度,但計算要求較高。例如,密度泛函理論(DFT)是一種廣泛使用的第一原理方法,它表現(xiàn)出隨系統(tǒng)尺寸的三次縮放,從而將其預(yù)測能力限制在小尺度上。
基于深度學習的混合方法
研究人員團隊現(xiàn)在提出了一種新穎的模擬方法,稱為材料學習算法(MALA)軟件堆棧。在計算機科學中,軟件堆棧是算法和軟件組件的集合,它們組合在一起創(chuàng)建用于解決特定問題的軟件應(yīng)用程序。
倫茨·費德勒博士CASUS的學生和MALA的主要開發(fā)人員解釋說:“MALA將機器學習與基于物理的方法相結(jié)合來預(yù)測材料的電子結(jié)構(gòu)。它采用了一種混合方法,利用一種稱為深度學習的既定機器學習方法來準確預(yù)測局部量,并輔以用于計算感興趣的全局量的物理算法。”
MALA軟件堆棧將空間中原子的排列作為輸入,并生成稱為雙譜分量的指紋,對笛卡爾網(wǎng)格點周圍原子的空間排列進行編碼。MALA中的機器學習模型經(jīng)過訓練,可以根據(jù)該原子鄰域預(yù)測電子結(jié)構(gòu)。MALA的一個顯著優(yōu)勢是其機器學習模型能夠獨立于系統(tǒng)規(guī)模,使其能夠根據(jù)小型系統(tǒng)的數(shù)據(jù)進行訓練并以任何規(guī)模進行部署。
研究小組在其出版物中展示了這一策略的顯著有效性。與傳統(tǒng)算法相比,對于由多達數(shù)千個原子組成的較小系統(tǒng)規(guī)模,他們實現(xiàn)了1,000倍以上的加速。此外,該團隊還證明了MALA能夠準確執(zhí)行大規(guī)模電子結(jié)構(gòu)計算,涉及超過100,000個原子。值得注意的是,這一成就是通過適度的計算工作實現(xiàn)的,揭示了傳統(tǒng)DFT代碼的局限性。
CASUS極端條件下物質(zhì)部門代理系主任AttilaCangi解釋道:“隨著系統(tǒng)規(guī)模的增大和涉及的原子數(shù)量的增加,DFT計算變得不切實際,而MALA的速度優(yōu)勢不斷增強。MALA的關(guān)鍵突破在于其“能夠在本地原子環(huán)境中運行,從而實現(xiàn)精確的數(shù)值預(yù)測,并且受系統(tǒng)尺寸的影響最小。這一突破性的成就開啟了曾經(jīng)被認為無法實現(xiàn)的計算可能性。”
預(yù)計將推動應(yīng)用研究
Cangi旨在利用機器學習突破電子結(jié)構(gòu)計算的界限。“我們預(yù)計MALA將引發(fā)電子結(jié)構(gòu)計算的變革,因為我們現(xiàn)在有一種方法可以以前所未有的速度模擬更大的系統(tǒng)。未來,研究人員將能夠基于顯著的計算能力解決廣泛的社會挑戰(zhàn)。改善基線,包括開發(fā)新疫苗和新型儲能材料、對半導體器件進行大規(guī)模模擬、研究材料缺陷以及探索將大氣溫室氣體二氧化碳轉(zhuǎn)化為氣候友好礦物質(zhì)的化學反應(yīng)。”
此外,MALA的方法特別適合高性能計算(HPC)。隨著系統(tǒng)規(guī)模的增長,MALA可以在其使用的計算網(wǎng)格上進行獨立處理,從而有效地利用HPC資源,特別是圖形處理單元。
桑迪亞國家實驗室的科學家兼并行計算專家SivaRajamanickam解釋說:“MALA的電子結(jié)構(gòu)計算算法很好地映射到具有分布式加速器的現(xiàn)代HPC系統(tǒng)。分解工作并跨不同網(wǎng)格點并行執(zhí)行的能力加速器使MALA成為HPC資源上可擴展機器學習的理想選擇,從而在電子結(jié)構(gòu)計算中實現(xiàn)無與倫比的速度和效率。”
標簽:
免責聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!