微軟研究院用深度學習"馴服"了量子化學里最難的未知量

2026-04-30 21:42:32　來源: 科技行者

天津舉報

分享至

這項研究由微軟研究院AI for Science團隊與澳大利亞新英格蘭大學合作完成，預印本發(fā)布于2025年6月，論文編號為arXiv:2506.14665，有興趣深入了解的讀者可通過該編號查詢完整論文。

**研究概要：一場持續(xù)了60年的"尋寶游戲"**

計算化學領域有一個持續(xù)了超過60年的困擾，它被研究者們半開玩笑地稱為"追尋神圣泛函"——這個比喻本身就道出了問題的難度。故事的核心是：我們想用計算機預測分子的行為，比如某種藥物分子能不能跟靶蛋白結合，某種材料能不能用于捕碳，或者某個化學反應會不會自發(fā)發(fā)生。這一切都取決于一個關鍵的物理量：分子中電子的能量。

問題在于，精確計算電子的能量需要求解量子力學方程，而這個方程的計算量隨電子數(shù)量的增加呈指數(shù)級爆炸，哪怕對幾十個電子的分子也足以讓超級計算機望而卻步。密度泛函理論（Density Functional Theory，簡稱DFT）在半個多世紀前提供了一條出路：不必追蹤每一個電子的運動軌跡，只需知道電子在空間中的密度分布，就可以（在理論上）精確算出總能量。這個方法把計算量壓縮到了可接受的范圍，因此DFT至今仍是計算化學和材料科學的主力工具。

然而，DFT本身有一個致命的"缺口"：整個理論框架里有一個叫做"交換相關泛函"的成分，沒有人知道它的精確形式，必須用近似公式來替代。這個近似的精度，直接決定了最終計算結果的可信度。60年來，科學家們不斷手工設計更精妙的近似公式，卻始終面臨一個兩難困境：精度越高的方法，計算代價越大；而廉價快速的方法，精度又不夠用。這個"精度-速度"的取舍，像一道無形的天花板壓在整個領域頭頂。

微軟研究院的這支團隊用深度學習打穿了這道天花板。他們開發(fā)的模型叫做Skala，它在主流主族化學基準測試GMTKN55上的精度超越了目前最先進的混合泛函，誤差低至每摩爾2.8千卡——而計算速度卻僅相當于廉價的半局域泛函。換句話說，Skala同時做到了"更準"和"更快"，這在此前被認為是相互排斥的目標。

**一、什么是"交換相關泛函"，為什么它這么重要**

要理解Skala的意義，先得搞清楚這個"交換相關泛函"究竟是什么東西。

把一個分子的電子系統(tǒng)比作一群人在一個房間里共同生活。這群人（電子）之間有兩種微妙的相互影響：一種來自量子力學的"泡利排斥"——同類電子天生不喜歡擠在同一個地方，就像性格相同的室友總會避開彼此；另一種來自經(jīng)典的庫侖斥力——帶負電的粒子互相排斥，就像磁鐵同極相斥。把這兩種效應都精確計算出來，就得到所謂的"交換相關能量"。

麻煩在于，這些效應涉及所有電子之間錯綜復雜的量子關聯(lián)，從原理上講需要知道電子在空間中所有可能位置的聯(lián)合概率分布，這正是讓計算量爆炸的根源。DFT的核心洞見是：理論上存在一個泛函（可以理解為一種特殊的"函數(shù)的函數(shù)"），只需把電子密度（一個相對簡單的量）輸入進去，就能輸出正確的交換相關能量。這個泛函在數(shù)學上被證明存在，但它長什么樣，至今無人知曉。

60年來，研究者們沿著一個被稱為"雅各布階梯"的框架往上爬，階梯的每一級代表一類近似方案。最底層的近似只用到局部電子密度本身；上一級加入了密度的梯度信息；再上一級加入了動能密度；而更高的層級則引入了軌道（波函數(shù)）級別的信息，代價是計算量從理論上的N的三次方攀升到N的四次方乃至更高。在這個框架里，精度和計算代價幾乎是捆綁在一起的：想要更準，就必須付出更多計算資源。

Skala的突破在于，它不沿著這個階梯往上爬，而是在較低的一級（元廣義梯度近似，meta-GGA，計算代價為N的三次方）停下來，然后通過神經(jīng)網(wǎng)絡學習網(wǎng)格點之間的非局域關聯(lián)，從數(shù)據(jù)中獲取了本應需要更高階梯才能獲得的精度。這就好比，一位棋手不靠死記硬背更多棋譜（更昂貴的計算），而是通過大量對局培養(yǎng)出對棋局整體走勢的直覺，反而下出了高手才能下出的棋。

**二、神經(jīng)網(wǎng)絡如何學習"量子直覺"：Skala的架構**

Skala模型的核心是一個神經(jīng)網(wǎng)絡，它負責學習并輸出一個叫做"增強因子"的量。這個增強因子乘以一個已知的簡單表達式（局域密度近似的交換能量密度），就得到最終的交換相關能量。

模型的輸入是分子中每個積分網(wǎng)格點上的7個半局域特征：上下自旋通道各自的電子密度值、密度梯度的平方、以及動能密度，還有總密度梯度的平方。這些都是在每個網(wǎng)格點上就能計算出來的局域量，不需要看其他位置的信息——這是保持低計算成本的前提。

然而，交換相關能量本質上是非局域的：一個地方的電子密度，會影響遠處的交換相關效應。Skala解決這個問題的方式頗具巧思。它引入了一套"粗粒度點"，也就是在每個原子核的位置放置一個代理節(jié)點。精細網(wǎng)格上的大量點通過球諧函數(shù)和徑向基函數(shù)的乘積"向上匯總"到對應原子的粗粒度點，這個過程類似于氣象學中把無數(shù)個氣象站的讀數(shù)匯總成一張?zhí)鞖鈭D；處理后，信息再"向下廣播"回精細網(wǎng)格。這樣，每個網(wǎng)格點的最終特征表示不僅包含了它自身的局域信息，還整合了整個原子附近區(qū)域的結構性信息。

這個過程被重復三次，形成三層非局域交互模塊。在每次匯總到粗粒度點之后，模型還會對這些匯總特征做一個"對稱收縮"操作，這個操作借鑒自機器力場領域的MACE架構，能夠捕捉三體乃至四體的相互關聯(lián)，而不僅僅是兩兩之間的關聯(lián)。

整個架構中，非局域部分的參數(shù)數(shù)量只有約5.4萬個，而局域部分約有33萬個，總參數(shù)量僅38.5萬。這個規(guī)模在深度學習領域稱不上大，但研究團隊的消融實驗（即分別訓練有非局域模塊和沒有非局域模塊的版本）表明，這個輕量級的非局域模塊帶來了約50%的誤差降低。換句話說，模型的大部分精度提升恰恰來自這個看似微小的設計。

模型最終輸出增強因子時，通過一個經(jīng)過縮放的S型函數(shù)（sigmoid）把輸出限制在0到2之間，確保它滿足一個叫做"Lieb-Oxford下界"的物理約束，即交換相關能量不能低于某個理論下限。這是團隊有意編入的少數(shù)幾個物理約束之一。

對于網(wǎng)格的收斂性，該架構經(jīng)過專門設計，使得當網(wǎng)格越來越細密時，計算結果會平滑收斂到一個確定值，行為與傳統(tǒng)泛函相似，這對實際使用至關重要。

**三、訓練數(shù)據(jù)的革命：沒有"ImageNet"級別的數(shù)據(jù)就沒有深度DFT**

模型再精巧，沒有足夠的數(shù)據(jù)也是巧婦難為無米之炊。過去機器學習方法在DFT領域進展遲緩，一個關鍵原因就是高精度數(shù)據(jù)極為稀缺。

生成高精度量子化學數(shù)據(jù)需要使用波函數(shù)方法，比如所謂的CCSD(T)方法（耦合簇理論，包括單重、雙重和微擾三重激發(fā)），這類方法計算代價極高，需要專業(yè)知識才能大規(guī)模可靠運行。微軟研究院團隊專門啟動了一個數(shù)據(jù)生成項目，構建了一個叫做"MSR-ACC"（Microsoft Research Accurate Chemistry Collection，微軟研究院精確化學數(shù)據(jù)集）的大規(guī)模數(shù)據(jù)集。

這個數(shù)據(jù)集目前包含約39.5萬條能量差標簽，全部通過W1-F12或W1w熱化學協(xié)議計算，達到CCSD(T)/CBS（完全基組極限）的精度。其中最大的一個子集是約12萬個總原子化能（即把一個分子拆解成所有單個原子所需的能量），涵蓋了含最多9個非氫原子的多樣化分子。

除總原子化能之外，數(shù)據(jù)集還包含了質子親和能、電子親和能、電離勢（包括雙重和三重電離）、反應路徑（包括過渡態(tài)）、非共價相互作用團簇（最多6個單體的分子團簇）、水二聚體勢能面上的大量構型、沿振動簡正模式扭曲的變形結構，以及氬以內各元素的原子性質數(shù)據(jù)。

這個內部數(shù)據(jù)集進一步用約8萬條來自公開數(shù)據(jù)集的數(shù)據(jù)增強，涵蓋非共價相互作用（NCIAtlas系列、DES370K）、分解能（MB2061人工"無厘頭"分子）、反應勢壘（BH9）以及少量過渡金屬數(shù)據(jù)。加上嚴格的測試集剔除（按分子圖匹配，把GMTKN55和W4-17中出現(xiàn)的分子從訓練集中排除），最終用于訓練Skala-1.1的數(shù)據(jù)約為40萬條能量差，這在該領域是前所未有的規(guī)模。

團隊把這個數(shù)據(jù)集類比為計算機視覺中的ImageNet——正是ImageNet這樣的大規(guī)模標注數(shù)據(jù)集，催生了2012年以后深度學習在圖像識別領域的革命。在量子化學這個專業(yè)程度極高、數(shù)據(jù)獲取極其昂貴的領域，構建這樣一個數(shù)據(jù)集本身就是一個重大的科學貢獻。

**四、"兩階段訓練"：先用固定地圖練習，再在真實道路上駕駛**

訓練一個交換相關泛函，面臨的挑戰(zhàn)遠比訓練普通機器力場復雜。問題的根源在于：泛函不是單獨被評估的，它被嵌入在一個叫做"自洽場"（SCF）的迭代求解過程中。每次預測分子能量，需要反復迭代直到軌道（電子波函數(shù)）和能量都收斂，整個過程像是在求解一個方程，而泛函本身就是方程的一部分。

這帶來兩個麻煩。第一，如果訓練過程中每次都需要跑完整的SCF迭代，成本比單次模型推斷高出許多倍，40萬條訓練數(shù)據(jù)的規(guī)模下根本不現(xiàn)實。第二，模型訓練初期參數(shù)隨機，泛函極差，SCF很可能根本不收斂，即使收斂了，得到的密度也是錯誤的，模型可能學會用"函數(shù)誤差"和"密度誤差"相互抵消來騙過損失函數(shù)，而不是真正學到物理。

團隊的解決方案是一個兩階段訓練協(xié)議。第一階段叫"預訓練"：不跑SCF，而是把每個分子的電子密度固定在用B3LYP泛函（一個成熟的混合泛函）預先算好的密度上，然后在這個固定密度上評估Skala，與高精度的波函數(shù)方法能量標簽比較，計算損失并反向傳播。這就像是先在模擬器上練習開車——模擬器的地圖（B3LYP密度）不是最精確的，但足夠接近真實，讓模型學會基本技能，而且成本極低，可以處理40萬條數(shù)據(jù)。損失函數(shù)針對的是反應能量差（而非總能量），因為高精度參考數(shù)據(jù)在能量差層面比總能量更可靠，誤差更小。

第一階段結束后，模型已經(jīng)能對固定的B3LYP密度給出合理預測，但還沒有被激勵去生成高質量的自洽密度。第二階段叫"自洽微調"：使用規(guī)模小得多的步數(shù)（約2萬步），在訓練時讓模型跑自己的SCF，用自己生成的自洽密度來評估，同樣與高精度能量標簽比較。這一階段不需要反向傳播穿過SCF迭代循環(huán)（利用了包絡定理——在能量極小值處，參數(shù)梯度等于在最優(yōu)密度處直接對泛函求導），因此成本仍然可控。

微調階段有一個關鍵監(jiān)測指標：偶極矩誤差。偶極矩（分子中正負電荷中心的分離程度）直接由電子密度分布決定，是衡量密度質量的獨立探針，與能量無關。研究團隊在整個微調過程中持續(xù)監(jiān)測偶極矩誤差和能量誤差，發(fā)現(xiàn)這兩者同時下降——說明模型在提高能量精度的同時，也在改善密度質量，而非靠密度變差來換取能量變好的錯誤補償。這是一個令人鼓舞的涌現(xiàn)行為，與精確泛函應有的性質一致。

**五、精度測試：在"化學界的高考"上擊敗頂尖選手**

GMTKN55是評估電子結構方法在主族化學（即元素周期表前幾行的普通有機/無機分子）上表現(xiàn)的權威標準測試集，由55個子數(shù)據(jù)集組成，涵蓋基本性質、熱化學、動力學（反應勢壘）、分子間非共價相互作用以及構象能量五大類別，總共約2000條參考數(shù)據(jù)。整體表現(xiàn)用一個叫WTMAD-2的加權平均絕對偏差來衡量，數(shù)值越小越準。

Skala-1.1在GMTKN55上的WTMAD-2為每摩爾2.80千卡。作為參照：常用的GGA泛函revPBE誤差為8.35，元GGA泛函r2SCAN為7.25，業(yè)界頗受好評的元GGA泛函B97M-V為5.56；進入混合泛函陣營，B3LYP誤差6.38，M06-2X為4.83，頂級的距離分離混合泛函ωB97X-V為3.96，表現(xiàn)最好的ωB97M-V為3.23。Skala-1.1以2.80的成績打敗了所有混合泛函，而其計算代價只相當于元GGA這一級別。

在55個子集中，Skala-1.1在32個上名列第一，比所有其他泛函加在一起還多。特別是在熱化學和反應勢壘這兩類子集上，Skala幾乎全面領先混合泛函。傳統(tǒng)觀念認為，反應勢壘的準確預測必須依賴混合泛函中的Hartree-Fock交換，因為自相互作用誤差會系統(tǒng)性地低估勢壘高度。而Skala的結果清楚表明，它從數(shù)據(jù)中學到了等效的非局域效應，無需任何精確交換。

有幾個子集值得特別提及。"MB16-43"是一組用人工隨機算法生成的"無厘頭分子"的分解能，化學成分極其離奇，對模型的外推能力是嚴峻考驗，Skala在這里表現(xiàn)格外突出，誤差僅2.57千卡，而排名第二的混合泛函誤差高達14.52千卡。"SIE4x4"測試與自相互作用誤差有關，Skala的誤差為12.68，低于大多數(shù)對比方法但高于最好的混合泛函（ωB97M-V的10.75）。"C60ISO"測試碳60異構體的相對能量，這類涉及大共軛體系的問題歷來是泛函的難點，Skala在這里誤差為8.16，不如部分混合泛函，表明在大型離域體系的非共價效應方面還有改進空間，這與模型目前未顯式建模色散相互作用有關（色散通過固定的D3后處理修正來補償）。

在W4-17基準上——這個測試集包含200個小分子的總原子化能，用比CCSD(T)/CBS更高級別的W4協(xié)議標注——Skala-1.1的整體平均絕對誤差為1.23千卡/摩爾。其中在183個單參考體系（即電子結構比較簡單的分子）上達到了化學精度（誤差低于1千卡/摩爾的傳統(tǒng)標準），MAE為0.92。對于17個多參考體系（電子間關聯(lián)極強，計算極難，訓練數(shù)據(jù)也缺乏覆蓋），誤差為4.61千卡，高于最佳混合泛函但不算差。

**六、不只是能量：密度質量與分子幾何的準確性**

一個好的泛函不只要預測準能量，還要能給出合理的電子密度和平衡幾何結構。

在密度質量上，研究團隊用偶極矩作為代理指標，對比了Hait和Head-Gordon整理的151個分子構型上的偶極矩基準。Skala-1.1的均方根誤差（RMSE，一種統(tǒng)計精度指標）為4.43%，優(yōu)于B3LYP（7.09%）、所有純GGA/meta-GGA泛函，以及混合泛函ωB97M-V（5.84%），與表現(xiàn)最好的ωB97X-V（5.18%）相當甚至略好。這一結果驗證了兩階段訓練協(xié)議的有效性：模型在提高能量精度的同時沒有犧牲密度質量。

在分子幾何方面，為了讓Skala能預測準確的平衡結構，團隊專門生成了一個叫做MSR-ACC/Distortion的訓練子集：從總原子化能集合中取出部分分子，沿振動簡正模式對它們做小幅擾動，計算擾動后與平衡結構之間的能量差，用W1w方法標注。這些標簽實際上編碼了勢能曲面在極小值附近的曲率信息，也就是原子間力常數(shù)，等價于高精度的平衡幾何信息。

加入這個數(shù)據(jù)子集之前，Skala的幾何優(yōu)化精度只有GGA級別；加入之后，精度迅速提升。在LMGB35（輕主族元素鍵長）、HMGB11（重主族元素鍵長）、CCse21（小分子鍵長和鍵角）以及W4-11-GEOM（W4-11分子的CCSD(T)/CBS優(yōu)化幾何結構）四個幾何基準上，Skala-1.1的表現(xiàn)與最好的混合泛函ωB97M-V相當，在某些指標上甚至更優(yōu)，同時優(yōu)于半經(jīng)驗方法GFN2-xTB。

GEO誤差（在自身優(yōu)化結構與參考結構上分別算能量、取差值，衡量用泛函做幾何優(yōu)化引入的額外誤差）在W4-11-GEOM上平均只有約0.02千卡/摩爾，幾乎可以忽略不計，說明Skala在"能量"和"結構"這兩項任務上能同時勝任。

**七、非局域效應的獨立驗證：分子"溫度計"與SN2反應**

研究團隊從兩個角度獨立驗證了Skala確實學到了重要的非局域效應。

Grimme等人最近提出了一種分子"溫度計"，通過測量某些分子在RHF-DFT和RKS-DFT兩種計算框架之間的能量差，可以量化一個泛函的有效非局域交換比例。CCSD(T)參考值約為60%。對比各泛函：revPBE約為11%，r2SCAN約為19%，B97M-V約為23%，B3LYP約為30%，M06-2X約為42%，ωB97M-V約為49%，ωB97X-V約為53%，而Skala-1.1達到了53.7%，與最好的范圍分離混合泛函相當，比所有純meta-GGA高出約一倍。這個測量是完全獨立于訓練過程的，它告訴我們：Skala通過數(shù)據(jù)學習，自發(fā)地編碼進了類似于大量Hartree-Fock交換的非局域量子效應。

另一個測試是SN2（雙分子親核取代）反應的勢壘預測。這類反應的過渡態(tài)有很強的非局域電子特征，歷來是普通半局域泛函的弱項，通常需要混合泛函才能給出合理答案。在W1-SN2-BH數(shù)據(jù)集（包含大量SN2反應勢壘的高精度數(shù)據(jù)集）上，使用ma-def2-QZVP基組，Skala-1.1的誤差為1.99千卡，與ωB97X-V（3.92）和ωB97M-V（2.09）相當，遠好于B97M-V（4.89）和revPBE（10.47）。考慮到SN2勢壘正是傳統(tǒng)認為必須用混合泛函才能處理好的典型問題，這個結果有力地支持了Skala已經(jīng)學會了在這方面發(fā)揮作用的非局域物理。

**八、計算成本：理論上的優(yōu)勢在真實機器上也成立**

在學術論文里聲稱"與meta-GGA成本相當"很容易，但實際運行時的性能受到軟件實現(xiàn)、硬件架構和預因子的影響，可能與理論漸近縮放大相徑庭。研究團隊通過嚴格的基準測試驗證了Skala的實際代價。

測試在GauXC庫（一個支持GPU加速的現(xiàn)代DFT積分庫）上進行，對38個規(guī)模從47個原子到910個原子的分子分別計算了交換相關積分的耗時，覆蓋了從約900到約2萬個基函數(shù)的范圍。所有測試使用def2-TZVP基組和GM3積分網(wǎng)格。

在GPU（NVIDIA A100）上，Skala-1.1的計算時間與r2SCAN（meta-GGA）在幾乎整個測試范圍內都非常接近，差距在30%以內。混合泛函B3LYP和M06-2X（需要額外計算精確交換積分）比Skala貴約3到6倍。擬合的冪律指數(shù)（反映計算量如何隨分子大小增長）：Skala為1.42，r2SCAN為1.34，B3LYP為1.80——Skala的縮放行為介于meta-GGA和混合泛函之間，但偏向meta-GGA側。

在CPU（AMD EPYC服務器，16線程）上，Skala對于較小分子的預因子約是r2SCAN的兩倍，但隨著分子變大，差距縮小，因為較大分子的計算時間越來越被原子軌道函數(shù)求值主導（這部分對所有方法都相同）。

另一個實用性障礙是軟件集成。傳統(tǒng)泛函通過libXC這樣的庫實現(xiàn)，每個網(wǎng)格點獨立計算，代碼結構簡單；而Skala的網(wǎng)格點間非局域通信與這一范式不兼容。研究團隊與GauXC庫合作，實現(xiàn)了一個"給定密度矩陣，內部處理所有網(wǎng)格操作，返回積分量"的接口，使Skala可以無縫嵌入支持GauXC的量子化學程序包。目前Psi4和CP2K已完成集成，PySCF也提供了直接接口，并通過Python、C/C++和Fortran接口向其他DFT程序開放。

**九、隨數(shù)據(jù)系統(tǒng)性提升：一個可持續(xù)進化的框架**

Skala的一個核心設計理念是"隨數(shù)據(jù)改善"，而非一個固定的靜態(tài)泛函。研究團隊通過數(shù)據(jù)消融實驗驗證了這一點。

實驗將訓練數(shù)據(jù)分為三組：A組包含熱化學（總原子化能、質子親和能等）、基本性質、變形幾何和過渡金屬原子數(shù)據(jù)；B組在A基礎上加入反應路徑和反應勢壘；C組進一步加入非共價相互作用和構象能量。在Diet GMTKN55（GMTKN55的代表性子集，100條反應）上評估：只訓練A組時，Skala平均表現(xiàn)約為GGA級別；加入B組后有明顯改善；加入C組后進一步降低WTMAD-2誤差。在每個階段，增加數(shù)據(jù)不僅降低了平均誤差，還減少了不同訓練隨機種子之間的方差，說明更多多樣化數(shù)據(jù)使模型更穩(wěn)健。

這種系統(tǒng)性改善行為，與深度學習在其他領域（如語言模型、圖像識別）中觀察到的規(guī)律一致：在給定架構下，誤差隨訓練數(shù)據(jù)量和多樣性的增加而單調下降。對量子化學來說，這意味著可以通過持續(xù)擴展高精度數(shù)據(jù)集來不斷提升泛函的精度和覆蓋范圍，而無需重新設計架構。

當前Skala-1.1是基于約40萬條數(shù)據(jù)訓練的。論文中提到，相比之前的Skala-1.0（基于約15萬條數(shù)據(jù)），精度有顯著提升，印證了這一規(guī)律。

**十、涌現(xiàn)的物理約束：大數(shù)據(jù)喂出來的物理直覺**

Skala設計時只編入了最少的物理約束（坐標縮放行為、尺寸一致性、Lieb-Oxford下界）以保持模型靈活性。因此，觀察模型是否能從數(shù)據(jù)中自發(fā)"學會"更多物理約束是一件非常有趣的事。

研究團隊檢驗了一個叫做"動力學相關能Tc正性"的約束。這個約束來自以下物理直覺：電子之間的量子關聯(lián)使它們互相回避，從而加速運動（就像在擁擠空間里每個人都要繞開別人，走路比空曠時更快），因此相關效應會增加動能，也就是說相關動能分量應該是正的。在純Kohn-Sham框架中，這個量（記為Tc）有精確的數(shù)學定義并且已知為正。

當Skala只在MSR-ACC/TAE25（總原子化能的一個子集，約5000條數(shù)據(jù)）上訓練時，Tc對多個原子呈現(xiàn)負值，表明約束被違反。但當在完整訓練集上訓練時，Tc對所有測試原子都變成正值，且數(shù)值與從CCSD密度反向工程得到的參考值相差不遠。

值得注意的是，Skala在廣義Kohn-Sham框架下運行（而非純Kohn-Sham），這種框架在原理上允許Tc偏離其純KS值，模型有更大自由度。但即使在這種更寬松的框架下，完整數(shù)據(jù)訓練的Skala仍然選擇了接近純KS值的Tc，這種行為在不同的隨機訓練種子下都穩(wěn)定復現(xiàn)。這說明：足夠多樣化的高精度數(shù)據(jù)，能讓神經(jīng)網(wǎng)絡自發(fā)學到深層次的物理規(guī)律，而無需將其硬編入約束。

**十一、過渡金屬：初探與未來路徑**

Skala-1.1主要面向主族化學，但研究團隊也在訓練集中加入了少量過渡金屬原子數(shù)據(jù)（3d和4d過渡金屬原子的電離勢和自旋分裂，以及少量雙原子分子鍵能）。在選定的過渡金屬基準測試上，Skala-1.1的表現(xiàn)與主流泛函大體相當：在"已見過"的數(shù)據(jù)集（如3d4dIPSS和TMD10）上表現(xiàn)合理；在"未見過"的測試集（如MOR41、MOBH35、3dTMV、ROST59）上，表現(xiàn)與r2SCAN等meta-GGA和部分混合泛函在同一檔次。這說明即使訓練信號極少，Kohn-Sham框架本身的物理內涵（主要能量成分已被精確計算，剩余的交換相關只是小的修正）使模型具備了一定的遷移能力。

研究者坦誠指出，要讓Skala在過渡金屬體系上真正可靠，需要大量擴展高精度過渡金屬數(shù)據(jù)的覆蓋范圍。對于多參考和強關聯(lián)體系（如某些重金屬化合物、過渡金屬氧化物等）的精確處理，還有賴于生成這類體系高精度參考數(shù)據(jù)的科學和計算方法的進步。

**結尾：說到底，這意味著什么**

歸根結底，Skala做到了一件被認為很難同時實現(xiàn)的事：在不增加計算代價的前提下，把DFT計算的精度提升到了過去只有更貴的方法才能達到的水平。這不是一次小幅的漸進式改進，而是對"精度越高必須花越多錢"這一長期規(guī)律的實質性突破。

對普通人而言，這類工具進步的影響是間接但深遠的。藥物研發(fā)中，計算機輔助篩選依賴DFT計算判斷候選分子與靶蛋白的結合能力，計算誤差大會導致太多無效候選分子進入昂貴的實驗驗證環(huán)節(jié)；材料科學中，電池、催化劑、碳捕獲材料的設計都需要高精度的能量計算來指導方向選擇。Skala這類工具的進步，意味著同等計算投入下可以更可靠地過濾候選方案，加速有效材料和藥物的發(fā)現(xiàn)。

當然，一些局限性值得清醒認識。Skala目前對色散（范德華力）相互作用仍依賴外部修正，尚未完全內化；對多參考體系的處理有明顯局限；在強關聯(lián)電子體系上的可靠性尚待驗證。SCF收斂性略差于傳統(tǒng)泛函（約1.1%的體系需要額外重試），在某些情況下需要手動干預。模型在訓練數(shù)據(jù)覆蓋的化學空間之外的外推能力，還需要更系統(tǒng)的測試。

不過，這項研究清晰地勾勒出了一條路：用大規(guī)模高精度數(shù)據(jù)驅動深度學習，可以系統(tǒng)性地改善交換相關泛函，而且隨著數(shù)據(jù)的不斷擴充，精度會持續(xù)提升。這與過去60年手工推導公式的范式不同——那條路已經(jīng)越來越接近其固有局限；而這條路，還遠遠沒有走到頭。

有興趣進一步探索的讀者，可以通過arXiv編號2506.14665找到完整論文，模型權重和推斷代碼已以MIT許可證在微軟的GitHub主頁開源，也可以在Azure AI Foundry平臺上直接體驗Skala的在線推斷服務。

Q&A

Q1：Skala泛函比傳統(tǒng)DFT方法好在哪里？

A：Skala通過深度學習神經(jīng)網(wǎng)絡學習了電子間非局域量子效應，在不增加計算成本的前提下，把精度提升到了傳統(tǒng)上只有更貴的混合泛函才能達到的水平。在GMTKN55主族化學基準上，Skala的加權平均誤差為2.80千卡/摩爾，超越了所有主流混合泛函，而計算代價只相當于半局域泛函。

Q2：Skala能處理過渡金屬體系嗎？

A：目前能力有限。Skala-1.1在訓練集中僅包含少量過渡金屬原子數(shù)據(jù)，在某些過渡金屬基準測試上能與主流泛函持平，但對復雜過渡金屬分子體系的可靠性尚不足夠。研究團隊明確表示，要提升過渡金屬精度需要大規(guī)模擴充高精度過渡金屬訓練數(shù)據(jù)，這是未來工作的主要方向之一。

Q3：Skala的模型代碼和權重可以下載使用嗎？

A：可以。Skala的模型代碼和預訓練權重已以MIT開源許可證發(fā)布在微軟GitHub主頁（github.com/microsoft/skala），支持通過PySCF、GPU4PySCF和ASE等量子化學程序調用，也可通過Azure AI Foundry平臺在線使用。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.