![]()
這項研究由微軟研究院AI for Science團隊與澳大利亞新英格蘭大學合作完成,預印本發(fā)布于2025年6月,論文編號為arXiv:2506.14665,有興趣深入了解的讀者可通過該編號查詢完整論文。
**研究概要:一場持續(xù)了60年的"尋寶游戲"**
計算化學領域有一個持續(xù)了超過60年的困擾,它被研究者們半開玩笑地稱為"追尋神圣泛函"——這個比喻本身就道出了問題的難度。故事的核心是:我們想用計算機預測分子的行為,比如某種藥物分子能不能跟靶蛋白結合,某種材料能不能用于捕碳,或者某個化學反應會不會自發(fā)發(fā)生。這一切都取決于一個關鍵的物理量:分子中電子的能量。
問題在于,精確計算電子的能量需要求解量子力學方程,而這個方程的計算量隨電子數(shù)量的增加呈指數(shù)級爆炸,哪怕對幾十個電子的分子也足以讓超級計算機望而卻步。密度泛函理論(Density Functional Theory,簡稱DFT)在半個多世紀前提供了一條出路:不必追蹤每一個電子的運動軌跡,只需知道電子在空間中的密度分布,就可以(在理論上)精確算出總能量。這個方法把計算量壓縮到了可接受的范圍,因此DFT至今仍是計算化學和材料科學的主力工具。
然而,DFT本身有一個致命的"缺口":整個理論框架里有一個叫做"交換相關泛函"的成分,沒有人知道它的精確形式,必須用近似公式來替代。這個近似的精度,直接決定了最終計算結果的可信度。60年來,科學家們不斷手工設計更精妙的近似公式,卻始終面臨一個兩難困境:精度越高的方法,計算代價越大;而廉價快速的方法,精度又不夠用。這個"精度-速度"的取舍,像一道無形的天花板壓在整個領域頭頂。
微軟研究院的這支團隊用深度學習打穿了這道天花板。他們開發(fā)的模型叫做Skala,它在主流主族化學基準測試GMTKN55上的精度超越了目前最先進的混合泛函,誤差低至每摩爾2.8千卡——而計算速度卻僅相當于廉價的半局域泛函。換句話說,Skala同時做到了"更準"和"更快",這在此前被認為是相互排斥的目標。
**一、什么是"交換相關泛函",為什么它這么重要**
要理解Skala的意義,先得搞清楚這個"交換相關泛函"究竟是什么東西。
把一個分子的電子系統(tǒng)比作一群人在一個房間里共同生活。這群人(電子)之間有兩種微妙的相互影響:一種來自量子力學的"泡利排斥"——同類電子天生不喜歡擠在同一個地方,就像性格相同的室友總會避開彼此;另一種來自經(jīng)典的庫侖斥力——帶負電的粒子互相排斥,就像磁鐵同極相斥。把這兩種效應都精確計算出來,就得到所謂的"交換相關能量"。
麻煩在于,這些效應涉及所有電子之間錯綜復雜的量子關聯(lián),從原理上講需要知道電子在空間中所有可能位置的聯(lián)合概率分布,這正是讓計算量爆炸的根源。DFT的核心洞見是:理論上存在一個泛函(可以理解為一種特殊的"函數(shù)的函數(shù)"),只需把電子密度(一個相對簡單的量)輸入進去,就能輸出正確的交換相關能量。這個泛函在數(shù)學上被證明存在,但它長什么樣,至今無人知曉。
60年來,研究者們沿著一個被稱為"雅各布階梯"的框架往上爬,階梯的每一級代表一類近似方案。最底層的近似只用到局部電子密度本身;上一級加入了密度的梯度信息;再上一級加入了動能密度;而更高的層級則引入了軌道(波函數(shù))級別的信息,代價是計算量從理論上的N的三次方攀升到N的四次方乃至更高。在這個框架里,精度和計算代價幾乎是捆綁在一起的:想要更準,就必須付出更多計算資源。
Skala的突破在于,它不沿著這個階梯往上爬,而是在較低的一級(元廣義梯度近似,meta-GGA,計算代價為N的三次方)停下來,然后通過神經(jīng)網(wǎng)絡學習網(wǎng)格點之間的非局域關聯(lián),從數(shù)據(jù)中獲取了本應需要更高階梯才能獲得的精度。這就好比,一位棋手不靠死記硬背更多棋譜(更昂貴的計算),而是通過大量對局培養(yǎng)出對棋局整體走勢的直覺,反而下出了高手才能下出的棋。
**二、神經(jīng)網(wǎng)絡如何學習"量子直覺":Skala的架構**
Skala模型的核心是一個神經(jīng)網(wǎng)絡,它負責學習并輸出一個叫做"增強因子"的量。這個增強因子乘以一個已知的簡單表達式(局域密度近似的交換能量密度),就得到最終的交換相關能量。
模型的輸入是分子中每個積分網(wǎng)格點上的7個半局域特征:上下自旋通道各自的電子密度值、密度梯度的平方、以及動能密度,還有總密度梯度的平方。這些都是在每個網(wǎng)格點上就能計算出來的局域量,不需要看其他位置的信息——這是保持低計算成本的前提。
然而,交換相關能量本質上是非局域的:一個地方的電子密度,會影響遠處的交換相關效應。Skala解決這個問題的方式頗具巧思。它引入了一套"粗粒度點",也就是在每個原子核的位置放置一個代理節(jié)點。精細網(wǎng)格上的大量點通過球諧函數(shù)和徑向基函數(shù)的乘積"向上匯總"到對應原子的粗粒度點,這個過程類似于氣象學中把無數(shù)個氣象站的讀數(shù)匯總成一張?zhí)鞖鈭D;處理后,信息再"向下廣播"回精細網(wǎng)格。這樣,每個網(wǎng)格點的最終特征表示不僅包含了它自身的局域信息,還整合了整個原子附近區(qū)域的結構性信息。
這個過程被重復三次,形成三層非局域交互模塊。在每次匯總到粗粒度點之后,模型還會對這些匯總特征做一個"對稱收縮"操作,這個操作借鑒自機器力場領域的MACE架構,能夠捕捉三體乃至四體的相互關聯(lián),而不僅僅是兩兩之間的關聯(lián)。
整個架構中,非局域部分的參數(shù)數(shù)量只有約5.4萬個,而局域部分約有33萬個,總參數(shù)量僅38.5萬。這個規(guī)模在深度學習領域稱不上大,但研究團隊的消融實驗(即分別訓練有非局域模塊和沒有非局域模塊的版本)表明,這個輕量級的非局域模塊帶來了約50%的誤差降低。換句話說,模型的大部分精度提升恰恰來自這個看似微小的設計。
模型最終輸出增強因子時,通過一個經(jīng)過縮放的S型函數(shù)(sigmoid)把輸出限制在0到2之間,確保它滿足一個叫做"Lieb-Oxford下界"的物理約束,即交換相關能量不能低于某個理論下限。這是團隊有意編入的少數(shù)幾個物理約束之一。
對于網(wǎng)格的收斂性,該架構經(jīng)過專門設計,使得當網(wǎng)格越來越細密時,計算結果會平滑收斂到一個確定值,行為與傳統(tǒng)泛函相似,這對實際使用至關重要。
**三、訓練數(shù)據(jù)的革命:沒有"ImageNet"級別的數(shù)據(jù)就沒有深度DFT**
模型再精巧,沒有足夠的數(shù)據(jù)也是巧婦難為無米之炊。過去機器學習方法在DFT領域進展遲緩,一個關鍵原因就是高精度數(shù)據(jù)極為稀缺。
生成高精度量子化學數(shù)據(jù)需要使用波函數(shù)方法,比如所謂的CCSD(T)方法(耦合簇理論,包括單重、雙重和微擾三重激發(fā)),這類方法計算代價極高,需要專業(yè)知識才能大規(guī)模可靠運行。微軟研究院團隊專門啟動了一個數(shù)據(jù)生成項目,構建了一個叫做"MSR-ACC"(Microsoft Research Accurate Chemistry Collection,微軟研究院精確化學數(shù)據(jù)集)的大規(guī)模數(shù)據(jù)集。
這個數(shù)據(jù)集目前包含約39.5萬條能量差標簽,全部通過W1-F12或W1w熱化學協(xié)議計算,達到CCSD(T)/CBS(完全基組極限)的精度。其中最大的一個子集是約12萬個總原子化能(即把一個分子拆解成所有單個原子所需的能量),涵蓋了含最多9個非氫原子的多樣化分子。
除總原子化能之外,數(shù)據(jù)集還包含了質子親和能、電子親和能、電離勢(包括雙重和三重電離)、反應路徑(包括過渡態(tài))、非共價相互作用團簇(最多6個單體的分子團簇)、水二聚體勢能面上的大量構型、沿振動簡正模式扭曲的變形結構,以及氬以內各元素的原子性質數(shù)據(jù)。
這個內部數(shù)據(jù)集進一步用約8萬條來自公開數(shù)據(jù)集的數(shù)據(jù)增強,涵蓋非共價相互作用(NCIAtlas系列、DES370K)、分解能(MB2061人工"無厘頭"分子)、反應勢壘(BH9)以及少量過渡金屬數(shù)據(jù)。加上嚴格的測試集剔除(按分子圖匹配,把GMTKN55和W4-17中出現(xiàn)的分子從訓練集中排除),最終用于訓練Skala-1.1的數(shù)據(jù)約為40萬條能量差,這在該領域是前所未有的規(guī)模。
團隊把這個數(shù)據(jù)集類比為計算機視覺中的ImageNet——正是ImageNet這樣的大規(guī)模標注數(shù)據(jù)集,催生了2012年以后深度學習在圖像識別領域的革命。在量子化學這個專業(yè)程度極高、數(shù)據(jù)獲取極其昂貴的領域,構建這樣一個數(shù)據(jù)集本身就是一個重大的科學貢獻。
**四、"兩階段訓練":先用固定地圖練習,再在真實道路上駕駛**
訓練一個交換相關泛函,面臨的挑戰(zhàn)遠比訓練普通機器力場復雜。問題的根源在于:泛函不是單獨被評估的,它被嵌入在一個叫做"自洽場"(SCF)的迭代求解過程中。每次預測分子能量,需要反復迭代直到軌道(電子波函數(shù))和能量都收斂,整個過程像是在求解一個方程,而泛函本身就是方程的一部分。
這帶來兩個麻煩。第一,如果訓練過程中每次都需要跑完整的SCF迭代,成本比單次模型推斷高出許多倍,40萬條訓練數(shù)據(jù)的規(guī)模下根本不現(xiàn)實。第二,模型訓練初期參數(shù)隨機,泛函極差,SCF很可能根本不收斂,即使收斂了,得到的密度也是錯誤的,模型可能學會用"函數(shù)誤差"和"密度誤差"相互抵消來騙過損失函數(shù),而不是真正學到物理。
團隊的解決方案是一個兩階段訓練協(xié)議。第一階段叫"預訓練":不跑SCF,而是把每個分子的電子密度固定在用B3LYP泛函(一個成熟的混合泛函)預先算好的密度上,然后在這個固定密度上評估Skala,與高精度的波函數(shù)方法能量標簽比較,計算損失并反向傳播。這就像是先在模擬器上練習開車——模擬器的地圖(B3LYP密度)不是最精確的,但足夠接近真實,讓模型學會基本技能,而且成本極低,可以處理40萬條數(shù)據(jù)。損失函數(shù)針對的是反應能量差(而非總能量),因為高精度參考數(shù)據(jù)在能量差層面比總能量更可靠,誤差更小。
第一階段結束后,模型已經(jīng)能對固定的B3LYP密度給出合理預測,但還沒有被激勵去生成高質量的自洽密度。第二階段叫"自洽微調":使用規(guī)模小得多的步數(shù)(約2萬步),在訓練時讓模型跑自己的SCF,用自己生成的自洽密度來評估,同樣與高精度能量標簽比較。這一階段不需要反向傳播穿過SCF迭代循環(huán)(利用了包絡定理——在能量極小值處,參數(shù)梯度等于在最優(yōu)密度處直接對泛函求導),因此成本仍然可控。
微調階段有一個關鍵監(jiān)測指標:偶極矩誤差。偶極矩(分子中正負電荷中心的分離程度)直接由電子密度分布決定,是衡量密度質量的獨立探針,與能量無關。研究團隊在整個微調過程中持續(xù)監(jiān)測偶極矩誤差和能量誤差,發(fā)現(xiàn)這兩者同時下降——說明模型在提高能量精度的同時,也在改善密度質量,而非靠密度變差來換取能量變好的錯誤補償。這是一個令人鼓舞的涌現(xiàn)行為,與精確泛函應有的性質一致。
**五、精度測試:在"化學界的高考"上擊敗頂尖選手**
GMTKN55是評估電子結構方法在主族化學(即元素周期表前幾行的普通有機/無機分子)上表現(xiàn)的權威標準測試集,由55個子數(shù)據(jù)集組成,涵蓋基本性質、熱化學、動力學(反應勢壘)、分子間非共價相互作用以及構象能量五大類別,總共約2000條參考數(shù)據(jù)。整體表現(xiàn)用一個叫WTMAD-2的加權平均絕對偏差來衡量,數(shù)值越小越準。
Skala-1.1在GMTKN55上的WTMAD-2為每摩爾2.80千卡。作為參照:常用的GGA泛函revPBE誤差為8.35,元GGA泛函r2SCAN為7.25,業(yè)界頗受好評的元GGA泛函B97M-V為5.56;進入混合泛函陣營,B3LYP誤差6.38,M06-2X為4.83,頂級的距離分離混合泛函ωB97X-V為3.96,表現(xiàn)最好的ωB97M-V為3.23。Skala-1.1以2.80的成績打敗了所有混合泛函,而其計算代價只相當于元GGA這一級別。
在55個子集中,Skala-1.1在32個上名列第一,比所有其他泛函加在一起還多。特別是在熱化學和反應勢壘這兩類子集上,Skala幾乎全面領先混合泛函。傳統(tǒng)觀念認為,反應勢壘的準確預測必須依賴混合泛函中的Hartree-Fock交換,因為自相互作用誤差會系統(tǒng)性地低估勢壘高度。而Skala的結果清楚表明,它從數(shù)據(jù)中學到了等效的非局域效應,無需任何精確交換。
有幾個子集值得特別提及。"MB16-43"是一組用人工隨機算法生成的"無厘頭分子"的分解能,化學成分極其離奇,對模型的外推能力是嚴峻考驗,Skala在這里表現(xiàn)格外突出,誤差僅2.57千卡,而排名第二的混合泛函誤差高達14.52千卡。"SIE4x4"測試與自相互作用誤差有關,Skala的誤差為12.68,低于大多數(shù)對比方法但高于最好的混合泛函(ωB97M-V的10.75)。"C60ISO"測試碳60異構體的相對能量,這類涉及大共軛體系的問題歷來是泛函的難點,Skala在這里誤差為8.16,不如部分混合泛函,表明在大型離域體系的非共價效應方面還有改進空間,這與模型目前未顯式建模色散相互作用有關(色散通過固定的D3后處理修正來補償)。
在W4-17基準上——這個測試集包含200個小分子的總原子化能,用比CCSD(T)/CBS更高級別的W4協(xié)議標注——Skala-1.1的整體平均絕對誤差為1.23千卡/摩爾。其中在183個單參考體系(即電子結構比較簡單的分子)上達到了化學精度(誤差低于1千卡/摩爾的傳統(tǒng)標準),MAE為0.92。對于17個多參考體系(電子間關聯(lián)極強,計算極難,訓練數(shù)據(jù)也缺乏覆蓋),誤差為4.61千卡,高于最佳混合泛函但不算差。
**六、不只是能量:密度質量與分子幾何的準確性**
一個好的泛函不只要預測準能量,還要能給出合理的電子密度和平衡幾何結構。
在密度質量上,研究團隊用偶極矩作為代理指標,對比了Hait和Head-Gordon整理的151個分子構型上的偶極矩基準。Skala-1.1的均方根誤差(RMSE,一種統(tǒng)計精度指標)為4.43%,優(yōu)于B3LYP(7.09%)、所有純GGA/meta-GGA泛函,以及混合泛函ωB97M-V(5.84%),與表現(xiàn)最好的ωB97X-V(5.18%)相當甚至略好。這一結果驗證了兩階段訓練協(xié)議的有效性:模型在提高能量精度的同時沒有犧牲密度質量。
在分子幾何方面,為了讓Skala能預測準確的平衡結構,團隊專門生成了一個叫做MSR-ACC/Distortion的訓練子集:從總原子化能集合中取出部分分子,沿振動簡正模式對它們做小幅擾動,計算擾動后與平衡結構之間的能量差,用W1w方法標注。這些標簽實際上編碼了勢能曲面在極小值附近的曲率信息,也就是原子間力常數(shù),等價于高精度的平衡幾何信息。
加入這個數(shù)據(jù)子集之前,Skala的幾何優(yōu)化精度只有GGA級別;加入之后,精度迅速提升。在LMGB35(輕主族元素鍵長)、HMGB11(重主族元素鍵長)、CCse21(小分子鍵長和鍵角)以及W4-11-GEOM(W4-11分子的CCSD(T)/CBS優(yōu)化幾何結構)四個幾何基準上,Skala-1.1的表現(xiàn)與最好的混合泛函ωB97M-V相當,在某些指標上甚至更優(yōu),同時優(yōu)于半經(jīng)驗方法GFN2-xTB。
GEO誤差(在自身優(yōu)化結構與參考結構上分別算能量、取差值,衡量用泛函做幾何優(yōu)化引入的額外誤差)在W4-11-GEOM上平均只有約0.02千卡/摩爾,幾乎可以忽略不計,說明Skala在"能量"和"結構"這兩項任務上能同時勝任。
**七、非局域效應的獨立驗證:分子"溫度計"與SN2反應**
研究團隊從兩個角度獨立驗證了Skala確實學到了重要的非局域效應。
Grimme等人最近提出了一種分子"溫度計",通過測量某些分子在RHF-DFT和RKS-DFT兩種計算框架之間的能量差,可以量化一個泛函的有效非局域交換比例。CCSD(T)參考值約為60%。對比各泛函:revPBE約為11%,r2SCAN約為19%,B97M-V約為23%,B3LYP約為30%,M06-2X約為42%,ωB97M-V約為49%,ωB97X-V約為53%,而Skala-1.1達到了53.7%,與最好的范圍分離混合泛函相當,比所有純meta-GGA高出約一倍。這個測量是完全獨立于訓練過程的,它告訴我們:Skala通過數(shù)據(jù)學習,自發(fā)地編碼進了類似于大量Hartree-Fock交換的非局域量子效應。
另一個測試是SN2(雙分子親核取代)反應的勢壘預測。這類反應的過渡態(tài)有很強的非局域電子特征,歷來是普通半局域泛函的弱項,通常需要混合泛函才能給出合理答案。在W1-SN2-BH數(shù)據(jù)集(包含大量SN2反應勢壘的高精度數(shù)據(jù)集)上,使用ma-def2-QZVP基組,Skala-1.1的誤差為1.99千卡,與ωB97X-V(3.92)和ωB97M-V(2.09)相當,遠好于B97M-V(4.89)和revPBE(10.47)。考慮到SN2勢壘正是傳統(tǒng)認為必須用混合泛函才能處理好的典型問題,這個結果有力地支持了Skala已經(jīng)學會了在這方面發(fā)揮作用的非局域物理。
**八、計算成本:理論上的優(yōu)勢在真實機器上也成立**
在學術論文里聲稱"與meta-GGA成本相當"很容易,但實際運行時的性能受到軟件實現(xiàn)、硬件架構和預因子的影響,可能與理論漸近縮放大相徑庭。研究團隊通過嚴格的基準測試驗證了Skala的實際代價。
測試在GauXC庫(一個支持GPU加速的現(xiàn)代DFT積分庫)上進行,對38個規(guī)模從47個原子到910個原子的分子分別計算了交換相關積分的耗時,覆蓋了從約900到約2萬個基函數(shù)的范圍。所有測試使用def2-TZVP基組和GM3積分網(wǎng)格。
在GPU(NVIDIA A100)上,Skala-1.1的計算時間與r2SCAN(meta-GGA)在幾乎整個測試范圍內都非常接近,差距在30%以內。混合泛函B3LYP和M06-2X(需要額外計算精確交換積分)比Skala貴約3到6倍。擬合的冪律指數(shù)(反映計算量如何隨分子大小增長):Skala為1.42,r2SCAN為1.34,B3LYP為1.80——Skala的縮放行為介于meta-GGA和混合泛函之間,但偏向meta-GGA側。
在CPU(AMD EPYC服務器,16線程)上,Skala對于較小分子的預因子約是r2SCAN的兩倍,但隨著分子變大,差距縮小,因為較大分子的計算時間越來越被原子軌道函數(shù)求值主導(這部分對所有方法都相同)。
另一個實用性障礙是軟件集成。傳統(tǒng)泛函通過libXC這樣的庫實現(xiàn),每個網(wǎng)格點獨立計算,代碼結構簡單;而Skala的網(wǎng)格點間非局域通信與這一范式不兼容。研究團隊與GauXC庫合作,實現(xiàn)了一個"給定密度矩陣,內部處理所有網(wǎng)格操作,返回積分量"的接口,使Skala可以無縫嵌入支持GauXC的量子化學程序包。目前Psi4和CP2K已完成集成,PySCF也提供了直接接口,并通過Python、C/C++和Fortran接口向其他DFT程序開放。
**九、隨數(shù)據(jù)系統(tǒng)性提升:一個可持續(xù)進化的框架**
Skala的一個核心設計理念是"隨數(shù)據(jù)改善",而非一個固定的靜態(tài)泛函。研究團隊通過數(shù)據(jù)消融實驗驗證了這一點。
實驗將訓練數(shù)據(jù)分為三組:A組包含熱化學(總原子化能、質子親和能等)、基本性質、變形幾何和過渡金屬原子數(shù)據(jù);B組在A基礎上加入反應路徑和反應勢壘;C組進一步加入非共價相互作用和構象能量。在Diet GMTKN55(GMTKN55的代表性子集,100條反應)上評估:只訓練A組時,Skala平均表現(xiàn)約為GGA級別;加入B組后有明顯改善;加入C組后進一步降低WTMAD-2誤差。在每個階段,增加數(shù)據(jù)不僅降低了平均誤差,還減少了不同訓練隨機種子之間的方差,說明更多多樣化數(shù)據(jù)使模型更穩(wěn)健。
這種系統(tǒng)性改善行為,與深度學習在其他領域(如語言模型、圖像識別)中觀察到的規(guī)律一致:在給定架構下,誤差隨訓練數(shù)據(jù)量和多樣性的增加而單調下降。對量子化學來說,這意味著可以通過持續(xù)擴展高精度數(shù)據(jù)集來不斷提升泛函的精度和覆蓋范圍,而無需重新設計架構。
當前Skala-1.1是基于約40萬條數(shù)據(jù)訓練的。論文中提到,相比之前的Skala-1.0(基于約15萬條數(shù)據(jù)),精度有顯著提升,印證了這一規(guī)律。
**十、涌現(xiàn)的物理約束:大數(shù)據(jù)喂出來的物理直覺**
Skala設計時只編入了最少的物理約束(坐標縮放行為、尺寸一致性、Lieb-Oxford下界)以保持模型靈活性。因此,觀察模型是否能從數(shù)據(jù)中自發(fā)"學會"更多物理約束是一件非常有趣的事。
研究團隊檢驗了一個叫做"動力學相關能Tc正性"的約束。這個約束來自以下物理直覺:電子之間的量子關聯(lián)使它們互相回避,從而加速運動(就像在擁擠空間里每個人都要繞開別人,走路比空曠時更快),因此相關效應會增加動能,也就是說相關動能分量應該是正的。在純Kohn-Sham框架中,這個量(記為Tc)有精確的數(shù)學定義并且已知為正。
當Skala只在MSR-ACC/TAE25(總原子化能的一個子集,約5000條數(shù)據(jù))上訓練時,Tc對多個原子呈現(xiàn)負值,表明約束被違反。但當在完整訓練集上訓練時,Tc對所有測試原子都變成正值,且數(shù)值與從CCSD密度反向工程得到的參考值相差不遠。
值得注意的是,Skala在廣義Kohn-Sham框架下運行(而非純Kohn-Sham),這種框架在原理上允許Tc偏離其純KS值,模型有更大自由度。但即使在這種更寬松的框架下,完整數(shù)據(jù)訓練的Skala仍然選擇了接近純KS值的Tc,這種行為在不同的隨機訓練種子下都穩(wěn)定復現(xiàn)。這說明:足夠多樣化的高精度數(shù)據(jù),能讓神經(jīng)網(wǎng)絡自發(fā)學到深層次的物理規(guī)律,而無需將其硬編入約束。
**十一、過渡金屬:初探與未來路徑**
Skala-1.1主要面向主族化學,但研究團隊也在訓練集中加入了少量過渡金屬原子數(shù)據(jù)(3d和4d過渡金屬原子的電離勢和自旋分裂,以及少量雙原子分子鍵能)。在選定的過渡金屬基準測試上,Skala-1.1的表現(xiàn)與主流泛函大體相當:在"已見過"的數(shù)據(jù)集(如3d4dIPSS和TMD10)上表現(xiàn)合理;在"未見過"的測試集(如MOR41、MOBH35、3dTMV、ROST59)上,表現(xiàn)與r2SCAN等meta-GGA和部分混合泛函在同一檔次。這說明即使訓練信號極少,Kohn-Sham框架本身的物理內涵(主要能量成分已被精確計算,剩余的交換相關只是小的修正)使模型具備了一定的遷移能力。
研究者坦誠指出,要讓Skala在過渡金屬體系上真正可靠,需要大量擴展高精度過渡金屬數(shù)據(jù)的覆蓋范圍。對于多參考和強關聯(lián)體系(如某些重金屬化合物、過渡金屬氧化物等)的精確處理,還有賴于生成這類體系高精度參考數(shù)據(jù)的科學和計算方法的進步。
**結尾:說到底,這意味著什么**
歸根結底,Skala做到了一件被認為很難同時實現(xiàn)的事:在不增加計算代價的前提下,把DFT計算的精度提升到了過去只有更貴的方法才能達到的水平。這不是一次小幅的漸進式改進,而是對"精度越高必須花越多錢"這一長期規(guī)律的實質性突破。
對普通人而言,這類工具進步的影響是間接但深遠的。藥物研發(fā)中,計算機輔助篩選依賴DFT計算判斷候選分子與靶蛋白的結合能力,計算誤差大會導致太多無效候選分子進入昂貴的實驗驗證環(huán)節(jié);材料科學中,電池、催化劑、碳捕獲材料的設計都需要高精度的能量計算來指導方向選擇。Skala這類工具的進步,意味著同等計算投入下可以更可靠地過濾候選方案,加速有效材料和藥物的發(fā)現(xiàn)。
當然,一些局限性值得清醒認識。Skala目前對色散(范德華力)相互作用仍依賴外部修正,尚未完全內化;對多參考體系的處理有明顯局限;在強關聯(lián)電子體系上的可靠性尚待驗證。SCF收斂性略差于傳統(tǒng)泛函(約1.1%的體系需要額外重試),在某些情況下需要手動干預。模型在訓練數(shù)據(jù)覆蓋的化學空間之外的外推能力,還需要更系統(tǒng)的測試。
不過,這項研究清晰地勾勒出了一條路:用大規(guī)模高精度數(shù)據(jù)驅動深度學習,可以系統(tǒng)性地改善交換相關泛函,而且隨著數(shù)據(jù)的不斷擴充,精度會持續(xù)提升。這與過去60年手工推導公式的范式不同——那條路已經(jīng)越來越接近其固有局限;而這條路,還遠遠沒有走到頭。
有興趣進一步探索的讀者,可以通過arXiv編號2506.14665找到完整論文,模型權重和推斷代碼已以MIT許可證在微軟的GitHub主頁開源,也可以在Azure AI Foundry平臺上直接體驗Skala的在線推斷服務。
Q&A
Q1:Skala泛函比傳統(tǒng)DFT方法好在哪里?
A:Skala通過深度學習神經(jīng)網(wǎng)絡學習了電子間非局域量子效應,在不增加計算成本的前提下,把精度提升到了傳統(tǒng)上只有更貴的混合泛函才能達到的水平。在GMTKN55主族化學基準上,Skala的加權平均誤差為2.80千卡/摩爾,超越了所有主流混合泛函,而計算代價只相當于半局域泛函。
Q2:Skala能處理過渡金屬體系嗎?
A:目前能力有限。Skala-1.1在訓練集中僅包含少量過渡金屬原子數(shù)據(jù),在某些過渡金屬基準測試上能與主流泛函持平,但對復雜過渡金屬分子體系的可靠性尚不足夠。研究團隊明確表示,要提升過渡金屬精度需要大規(guī)模擴充高精度過渡金屬訓練數(shù)據(jù),這是未來工作的主要方向之一。
Q3:Skala的模型代碼和權重可以下載使用嗎?
A:可以。Skala的模型代碼和預訓練權重已以MIT開源許可證發(fā)布在微軟GitHub主頁(github.com/microsoft/skala),支持通過PySCF、GPU4PySCF和ASE等量子化學程序調用,也可通過Azure AI Foundry平臺在線使用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.