AI摘要:研究由微软研究院AI for Science团队与澳大利亚新英格兰大学合作完成,预印本发布于2025年6月,论文编号为arXiv:2506.14665,有兴趣深入了解的读者可通过该编号查询完整论文。 这与过去60年手工推导公式的范式不同——那条路已经越来越接近其固有局限;而这条路,还远远没有走到头。 偶极矩(分子中正负电荷中心的分离程度)直接由电子密度分布决定,是衡量密度质量的独立探针,与能量无关。
这项研究由微软研究院AI for Science团队与澳大利亚新英格兰大学合作完成,预印本发布于2025年6月,论文编号为arXiv:2506.14665,有兴趣深入了解的读者可通过该编号查询完整论文。
生成高精度量子化学数据需要使用波函数方法,比如所谓的CCSD(T)方法(耦合簇理论,包括单重、双重和微扰三重激发),这类方法计算代价极高,需要专业知识才能大规模可靠运行。微软研究院团队专门启动了一个数据生成项目,构建了一个叫做"MSR-ACC"(Microsoft Research Accurate Chemistry Collection,微软研究院精确化学数据集)的大规模数据集。
这项研究由微软研究院AI for Science团队与澳大利亚新英格兰大学合作完成,预印本发布于2025年6月,论文编号为arXiv:2506.14665,有兴趣深入了解的读者可通过该编号查询完整论文。
研究概要:一场持续了60年的"寻宝游戏"
计算化学领域有一个持续了超过60年的困扰,它被研究者们半开玩笑地称为"追寻神圣泛函"——这个比喻本身就道出了问题的难度。故事的核心是:我们想用计算机预测分子的行为,比如某种药物分子能不能跟靶蛋白结合,某种材料能不能用于捕碳,或者某个化学反应会不会自发发生。这一切都取决于一个关键的物理量:分子中电子的能量。
问题在于,精确计算电子的能量需要求解量子力学方程,而这个方程的计算量随电子数量的增加呈指数级爆炸,哪怕对几十个电子的分子也足以让超级计算机望而却步。密度泛函理论(Density Functional Theory,简称DFT)在半个多世纪前提供了一条出路:不必追踪每一个电子的运动轨迹,只需知道电子在空间中的密度分布,就可以(在理论上)精确算出总能量。这个方法把计算量压缩到了可接受的范围,因此DFT至今仍是计算化学和材料科学的主力工具。
然而,DFT本身有一个致命的"缺口":整个理论框架里有一个叫做"交换相关泛函"的成分,没有人知道它的精确形式,必须用近似公式来替代。这个近似的精度,直接决定了最终计算结果的可信度。60年来,科学家们不断手工设计更精妙的近似公式,却始终面临一个两难困境:精度越高的方法,计算代价越大;而廉价快速的方法,精度又不够用。这个"精度-速度"的取舍,像一道无形的天花板压在整个领域头顶。
微软研究院的这支团队用深度学习打穿了这道天花板。他们开发的模型叫做Skala,它在主流主族化学基准测试GMTKN55上的精度超越了目前最先进的混合泛函,误差低至每摩尔2.8千卡——而计算速度却仅相当于廉价的半局域泛函。换句话说,Skala同时做到了"更准"和"更快",这在此前被认为是相互排斥的目标。
一、什么是"交换相关泛函",为什么它这么重要
要理解Skala的意义,先得搞清楚这个"交换相关泛函"究竟是什么东西。
把一个分子的电子系统比作一群人在一个房间里共同生活。这群人(电子)之间有两种微妙的相互影响:一种来自量子力学的"泡利排斥"——同类电子天生不喜欢挤在同一个地方,就像性格相同的室友总会避开彼此;另一种来自经典的库仑斥力——带负电的粒子互相排斥,就像磁铁同极相斥。把这两种效应都精确计算出来,就得到所谓的"交换相关能量"。
麻烦在于,这些效应涉及所有电子之间错综复杂的量子关联,从原理上讲需要知道电子在空间中所有可能位置的联合概率分布,这正是让计算量爆炸的根源。DFT的核心洞见是:理论上存在一个泛函(可以理解为一种特殊的"函数的函数"),只需把电子密度(一个相对简单的量)输入进去,就能输出正确的交换相关能量。这个泛函在数学上被证明存在,但它长什么样,至今无人知晓。
60年来,研究者们沿着一个被称为"雅各布阶梯"的框架往上爬,阶梯的每一级代表一类近似方案。最底层的近似只用到局部电子密度本身;上一级加入了密度的梯度信息;再上一级加入了动能密度;而更高的层级则引入了轨道(波函数)级别的信息,代价是计算量从理论上的N的三次方攀升到N的四次方乃至更高。在这个框架里,精度和计算代价几乎是捆绑在一起的:想要更准,就必须付出更多计算资源。
Skala的突破在于,它不沿着这个阶梯往上爬,而是在较低的一级(元广义梯度近似,meta-GGA,计算代价为N的三次方)停下来,然后通过神经网络学习网格点之间的非局域关联,从数据中获取了本应需要更高阶梯才能获得的精度。这就好比,一位棋手不靠死记硬背更多棋谱(更昂贵的计算),而是通过大量对局培养出对棋局整体走势的直觉,反而下出了高手才能下出的棋。
二、神经网络如何学习"量子直觉":Skala的架构
Skala模型的核心是一个神经网络,它负责学习并输出一个叫做"增强因子"的量。这个增强因子乘以一个已知的简单表达式(局域密度近似的交换能量密度),就得到最终的交换相关能量。
模型的输入是分子中每个积分网格点上的7个半局域特征:上下自旋通道各自的电子密度值、密度梯度的平方、以及动能密度,还有总密度梯度的平方。这些都是在每个网格点上就能计算出来的局域量,不需要看其他位置的信息——这是保持低计算成本的前提。
然而,交换相关能量本质上是非局域的:一个地方的电子密度,会影响远处的交换相关效应。Skala解决这个问题的方式颇具巧思。它引入了一套"粗粒度点",也就是在每个原子核的位置放置一个代理节点。精细网格上的大量点通过球谐函数和径向基函数的乘积"向上汇总"到对应原子的粗粒度点,这个过程类似于气象学中把无数个气象站的读数汇总成一张天气图;处理后,信息再"向下广播"回精细网格。这样,每个网格点的最终特征表示不仅包含了它自身的局域信息,还整合了整个原子附近区域的结构性信息。
这个过程被重复三次,形成三层非局域交互模块。在每次汇总到粗粒度点之后,模型还会对这些汇总特征做一个"对称收缩"操作,这个操作借鉴自机器力场领域的MACE架构,能够捕捉三体乃至四体的相互关联,而不仅仅是两两之间的关联。
整个架构中,非局域部分的参数数量只有约5.4万个,而局域部分约有33万个,总参数量仅38.5万。这个规模在深度学习领域称不上大,但研究团队的消融实验(即分别训练有非局域模块和没有非局域模块的版本)表明,这个轻量级的非局域模块带来了约50%的误差降低。换句话说,模型的大部分精度提升恰恰来自这个看似微小的设计。
模型最终输出增强因子时,通过一个经过缩放的S型函数(sigmoid)把输出限制在0到2之间,确保它满足一个叫做"Lieb-Oxford下界"的物理约束,即交换相关能量不能低于某个理论下限。这是团队有意编入的少数几个物理约束之一。
对于网格的收敛性,该架构经过专门设计,使得当网格越来越细密时,计算结果会平滑收敛到一个确定值,行为与传统泛函相似,这对实际使用至关重要。
三、训练数据的革命:没有"ImageNet"级别的数据就没有深度DFT
模型再精巧,没有足够的数据也是巧妇难为无米之炊。过去机器学习方法在DFT领域进展迟缓,一个关键原因就是高精度数据极为稀缺。
生成高精度量子化学数据需要使用波函数方法,比如所谓的CCSD(T)方法(耦合簇理论,包括单重、双重和微扰三重激发),这类方法计算代价极高,需要专业知识才能大规模可靠运行。微软研究院团队专门启动了一个数据生成项目,构建了一个叫做"MSR-ACC"(Microsoft Research Accurate Chemistry Collection,微软研究院精确化学数据集)的大规模数据集。
这个数据集目前包含约39.5万条能量差标签,全部通过W1-F12或W1w热化学协议计算,达到CCSD(T)/CBS(完全基组极限)的精度。其中最大的一个子集是约12万个总原子化能(即把一个分子拆解成所有单个原子所需的能量),涵盖了含最多9个非氢原子的多样化分子。
除总原子化能之外,数据集还包含了质子亲和能、电子亲和能、电离势(包括双重和三重电离)、反应路径(包括过渡态)、非共价相互作用团簇(最多6个单体的分子团簇)、水二聚体势能面上的大量构型、沿振动简正模式扭曲的变形结构,以及氩以内各元素的原子性质数据。
这个内部数据集进一步用约8万条来自公开数据集的数据增强,涵盖非共价相互作用(NCIAtlas系列、DES370K)、分解能(MB2061人工"无厘头"分子)、反应势垒(BH9)以及少量过渡金属数据。加上严格的测试集剔除(按分子图匹配,把GMTKN55和W4-17中出现的分子从训练集中排除),最终用于训练Skala-1.1的数据约为40万条能量差,这在该领域是前所未有的规模。
团队把这个数据集类比为计算机视觉中的ImageNet——正是ImageNet这样的大规模标注数据集,催生了2012年以后深度学习在图像识别领域的革命。在量子化学这个专业程度极高、数据获取极其昂贵的领域,构建这样一个数据集本身就是一个重大的科学贡献。
四、"两阶段训练":先用固定地图练习,再在真实道路上驾驶
训练一个交换相关泛函,面临的挑战远比训练普通机器力场复杂。问题的根源在于:泛函不是单独被评估的,它被嵌入在一个叫做"自洽场"(SCF)的迭代求解过程中。每次预测分子能量,需要反复迭代直到轨道(电子波函数)和能量都收敛,整个过程像是在求解一个方程,而泛函本身就是方程的一部分。
这带来两个麻烦。第一,如果训练过程中每次都需要跑完整的SCF迭代,成本比单次模型推断高出许多倍,40万条训练数据的规模下根本不现实。第二,模型训练初期参数随机,泛函极差,SCF很可能根本不收敛,即使收敛了,得到的密度也是错误的,模型可能学会用"函数误差"和"密度误差"相互抵消来骗过损失函数,而不是真正学到物理。
团队的解决方案是一个两阶段训练协议。第一阶段叫"预训练":不跑SCF,而是把每个分子的电子密度固定在用B3LYP泛函(一个成熟的混合泛函)预先算好的密度上,然后在这个固定密度上评估Skala,与高精度的波函数方法能量标签比较,计算损失并反向传播。这就像是先在模拟器上练习开车——模拟器的地图(B3LYP密度)不是最精确的,但足够接近真实,让模型学会基本技能,而且成本极低,可以处理40万条数据。损失函数针对的是反应能量差(而非总能量),因为高精度参考数据在能量差层面比总能量更可靠,误差更小。
第一阶段结束后,模型已经能对固定的B3LYP密度给出合理预测,但还没有被激励去生成高质量的自洽密度。第二阶段叫"自洽微调":使用规模小得多的步数(约2万步),在训练时让模型跑自己的SCF,用自己生成的自洽密度来评估,同样与高精度能量标签比较。这一阶段不需要反向传播穿过SCF迭代循环(利用了包络定理——在能量极小值处,参数梯度等于在最优密度处直接对泛函求导),因此成本仍然可控。
微调阶段有一个关键监测指标:偶极矩误差。偶极矩(分子中正负电荷中心的分离程度)直接由电子密度分布决定,是衡量密度质量的独立探针,与能量无关。研究团队在整个微调过程中持续监测偶极矩误差和能量误差,发现这两者同时下降——说明模型在提高能量精度的同时,也在改善密度质量,而非靠密度变差来换取能量变好的错误补偿。这是一个令人鼓舞的涌现行为,与精确泛函应有的性质一致。
五、精度测试:在"化学界的高考"上击败顶尖选手
GMTKN55是评估电子结构方法在主族化学(即元素周期表前几行的普通有机/无机分子)上表现的权威标准测试集,由55个子数据集组成,涵盖基本性质、热化学、动力学(反应势垒)、分子间非共价相互作用以及构象能量五大类别,总共约2000条参考数据。整体表现用一个叫WTMAD-2的加权平均绝对偏差来衡量,数值越小越准。
Skala-1.1在GMTKN55上的WTMAD-2为每摩尔2.80千卡。作为参照:常用的GGA泛函revPBE误差为8.35,元GGA泛函r2SCAN为7.25,业界颇受好评的元GGA泛函B97M-V为5.56;进入混合泛函阵营,B3LYP误差6.38,M06-2X为4.83,顶级的距离分离混合泛函ωB97X-V为3.96,表现最好的ωB97M-V为3.23。Skala-1.1以2.80的成绩打败了所有混合泛函,而其计算代价只相当于元GGA这一级别。
在55个子集中,Skala-1.1在32个上名列第一,比所有其他泛函加在一起还多。特别是在热化学和反应势垒这两类子集上,Skala几乎全面领先混合泛函。传统观念认为,反应势垒的准确预测必须依赖混合泛函中的Hartree-Fock交换,因为自相互作用误差会系统性地低估势垒高度。而Skala的结果清楚表明,它从数据中学到了等效的非局域效应,无需任何精确交换。
有几个子集值得特别提及。"MB16-43"是一组用人工随机算法生成的"无厘头分子"的分解能,化学成分极其离奇,对模型的外推能力是严峻考验,Skala在这里表现格外突出,误差仅2.57千卡,而排名第二的混合泛函误差高达14.52千卡。"SIE4x4"测试与自相互作用误差有关,Skala的误差为12.68,低于大多数对比方法但高于最好的混合泛函(ωB97M-V的10.75)。"C60ISO"测试碳60异构体的相对能量,这类涉及大共轭体系的问题历来是泛函的难点,Skala在这里误差为8.16,不如部分混合泛函,表明在大型离域体系的非共价效应方面还有改进空间,这与模型目前未显式建模色散相互作用有关(色散通过固定的D3后处理修正来补偿)。
在W4-17基准上——这个测试集包含200个小分子的总原子化能,用比CCSD(T)/CBS更高级别的W4协议标注——Skala-1.1的整体平均绝对误差为1.23千卡/摩尔。其中在183个单参考体系(即电子结构比较简单的分子)上达到了化学精度(误差低于1千卡/摩尔的传统标准),MAE为0.92。对于17个多参考体系(电子间关联极强,计算极难,训练数据也缺乏覆盖),误差为4.61千卡,高于最佳混合泛函但不算差。
六、不只是能量:密度质量与分子几何的准确性
一个好的泛函不只要预测准能量,还要能给出合理的电子密度和平衡几何结构。
在密度质量上,研究团队用偶极矩作为代理指标,对比了Hait和Head-Gordon整理的151个分子构型上的偶极矩基准。Skala-1.1的均方根误差(RMSE,一种统计精度指标)为4.43%,优于B3LYP(7.09%)、所有纯GGA/meta-GGA泛函,以及混合泛函ωB97M-V(5.84%),与表现最好的ωB97X-V(5.18%)相当甚至略好。这一结果验证了两阶段训练协议的有效性:模型在提高能量精度的同时没有牺牲密度质量。
在分子几何方面,为了让Skala能预测准确的平衡结构,团队专门生成了一个叫做MSR-ACC/Distortion的训练子集:从总原子化能集合中取出部分分子,沿振动简正模式对它们做小幅扰动,计算扰动后与平衡结构之间的能量差,用W1w方法标注。这些标签实际上编码了势能曲面在极小值附近的曲率信息,也就是原子间力常数,等价于高精度的平衡几何信息。
加入这个数据子集之前,Skala的几何优化精度只有GGA级别;加入之后,精度迅速提升。在LMGB35(轻主族元素键长)、HMGB11(重主族元素键长)、CCse21(小分子键长和键角)以及W4-11-GEOM(W4-11分子的CCSD(T)/CBS优化几何结构)四个几何基准上,Skala-1.1的表现与最好的混合泛函ωB97M-V相当,在某些指标上甚至更优,同时优于半经验方法GFN2-xTB。
GEO误差(在自身优化结构与参考结构上分别算能量、取差值,衡量用泛函做几何优化引入的额外误差)在W4-11-GEOM上平均只有约0.02千卡/摩尔,几乎可以忽略不计,说明Skala在"能量"和"结构"这两项任务上能同时胜任。
七、非局域效应的独立验证:分子"温度计"与SN2反应
研究团队从两个角度独立验证了Skala确实学到了重要的非局域效应。
Grimme等人最近提出了一种分子"温度计",通过测量某些分子在RHF-DFT和RKS-DFT两种计算框架之间的能量差,可以量化一个泛函的有效非局域交换比例。CCSD(T)参考值约为60%。对比各泛函:revPBE约为11%,r2SCAN约为19%,B97M-V约为23%,B3LYP约为30%,M06-2X约为42%,ωB97M-V约为49%,ωB97X-V约为53%,而Skala-1.1达到了53.7%,与最好的范围分离混合泛函相当,比所有纯meta-GGA高出约一倍。这个测量是完全独立于训练过程的,它告诉我们:Skala通过数据学习,自发地编码进了类似于大量Hartree-Fock交换的非局域量子效应。
另一个测试是SN2(双分子亲核取代)反应的势垒预测。这类反应的过渡态有很强的非局域电子特征,历来是普通半局域泛函的弱项,通常需要混合泛函才能给出合理答案。在W1-SN2-BH数据集(包含大量SN2反应势垒的高精度数据集)上,使用ma-def2-QZVP基组,Skala-1.1的误差为1.99千卡,与ωB97X-V(3.92)和ωB97M-V(2.09)相当,远好于B97M-V(4.89)和revPBE(10.47)。考虑到SN2势垒正是传统认为必须用混合泛函才能处理好的典型问题,这个结果有力地支持了Skala已经学会了在这方面发挥作用的非局域物理。
八、计算成本:理论上的优势在真实机器上也成立
在学术论文里声称"与meta-GGA成本相当"很容易,但实际运行时的性能受到软件实现、硬件架构和预因子的影响,可能与理论渐近缩放大相径庭。研究团队通过严格的基准测试验证了Skala的实际代价。
测试在GauXC库(一个支持GPU加速的现代DFT积分库)上进行,对38个规模从47个原子到910个原子的分子分别计算了交换相关积分的耗时,覆盖了从约900到约2万个基函数的范围。所有测试使用def2-TZVP基组和GM3积分网格。
在GPU(NVIDIA A100)上,Skala-1.1的计算时间与r2SCAN(meta-GGA)在几乎整个测试范围内都非常接近,差距在30%以内。混合泛函B3LYP和M06-2X(需要额外计算精确交换积分)比Skala贵约3到6倍。拟合的幂律指数(反映计算量如何随分子大小增长):Skala为1.42,r2SCAN为1.34,B3LYP为1.80——Skala的缩放行为介于meta-GGA和混合泛函之间,但偏向meta-GGA侧。
在CPU(AMD EPYC服务器,16线程)上,Skala对于较小分子的预因子约是r2SCAN的两倍,但随着分子变大,差距缩小,因为较大分子的计算时间越来越被原子轨道函数求值主导(这部分对所有方法都相同)。
另一个实用性障碍是软件集成。传统泛函通过libXC这样的库实现,每个网格点独立计算,代码结构简单;而Skala的网格点间非局域通信与这一范式不兼容。研究团队与GauXC库合作,实现了一个"给定密度矩阵,内部处理所有网格操作,返回积分量"的接口,使Skala可以无缝嵌入支持GauXC的量子化学程序包。目前Psi4和CP2K已完成集成,PySCF也提供了直接接口,并通过Python、C/C++和Fortran接口向其他DFT程序开放。
九、随数据系统性提升:一个可持续进化的框架
Skala的一个核心设计理念是"随数据改善",而非一个固定的静态泛函。研究团队通过数据消融实验验证了这一点。
实验将训练数据分为三组:A组包含热化学(总原子化能、质子亲和能等)、基本性质、变形几何和过渡金属原子数据;B组在A基础上加入反应路径和反应势垒;C组进一步加入非共价相互作用和构象能量。在Diet GMTKN55(GMTKN55的代表性子集,100条反应)上评估:只训练A组时,Skala平均表现约为GGA级别;加入B组后有明显改善;加入C组后进一步降低WTMAD-2误差。在每个阶段,增加数据不仅降低了平均误差,还减少了不同训练随机种子之间的方差,说明更多多样化数据使模型更稳健。
这种系统性改善行为,与深度学习在其他领域(如语言模型、图像识别)中观察到的规律一致:在给定架构下,误差随训练数据量和多样性的增加而单调下降。对量子化学来说,这意味着可以通过持续扩展高精度数据集来不断提升泛函的精度和覆盖范围,而无需重新设计架构。
当前Skala-1.1是基于约40万条数据训练的。论文中提到,相比之前的Skala-1.0(基于约15万条数据),精度有显著提升,印证了这一规律。
十、涌现的物理约束:大数据喂出来的物理直觉
Skala设计时只编入了最少的物理约束(坐标缩放行为、尺寸一致性、Lieb-Oxford下界)以保持模型灵活性。因此,观察模型是否能从数据中自发"学会"更多物理约束是一件非常有趣的事。
研究团队检验了一个叫做"动力学相关能Tc正性"的约束。这个约束来自以下物理直觉:电子之间的量子关联使它们互相回避,从而加速运动(就像在拥挤空间里每个人都要绕开别人,走路比空旷时更快),因此相关效应会增加动能,也就是说相关动能分量应该是正的。在纯Kohn-Sham框架中,这个量(记为Tc)有精确的数学定义并且已知为正。
当Skala只在MSR-ACC/TAE25(总原子化能的一个子集,约5000条数据)上训练时,Tc对多个原子呈现负值,表明约束被违反。但当在完整训练集上训练时,Tc对所有测试原子都变成正值,且数值与从CCSD密度反向工程得到的参考值相差不远。
值得注意的是,Skala在广义Kohn-Sham框架下运行(而非纯Kohn-Sham),这种框架在原理上允许Tc偏离其纯KS值,模型有更大自由度。但即使在这种更宽松的框架下,完整数据训练的Skala仍然选择了接近纯KS值的Tc,这种行为在不同的随机训练种子下都稳定复现。这说明:足够多样化的高精度数据,能让神经网络自发学到深层次的物理规律,而无需将其硬编入约束。
十一、过渡金属:初探与未来路径
Skala-1.1主要面向主族化学,但研究团队也在训练集中加入了少量过渡金属原子数据(3d和4d过渡金属原子的电离势和自旋分裂,以及少量双原子分子键能)。在选定的过渡金属基准测试上,Skala-1.1的表现与主流泛函大体相当:在"已见过"的数据集(如3d4dIPSS和TMD10)上表现合理;在"未见过"的测试集(如MOR41、MOBH35、3dTMV、ROST59)上,表现与r2SCAN等meta-GGA和部分混合泛函在同一档次。这说明即使训练信号极少,Kohn-Sham框架本身的物理内涵(主要能量成分已被精确计算,剩余的交换相关只是小的修正)使模型具备了一定的迁移能力。
研究者坦诚指出,要让Skala在过渡金属体系上真正可靠,需要大量扩展高精度过渡金属数据的覆盖范围。对于多参考和强关联体系(如某些重金属化合物、过渡金属氧化物等)的精确处理,还有赖于生成这类体系高精度参考数据的科学和计算方法的进步。
结尾:说到底,这意味着什么
归根结底,Skala做到了一件被认为很难同时实现的事:在不增加计算代价的前提下,把DFT计算的精度提升到了过去只有更贵的方法才能达到的水平。这不是一次小幅的渐进式改进,而是对"精度越高必须花越多钱"这一长期规律的实质性突破。
对普通人而言,这类工具进步的影响是间接但深远的。药物研发中,计算机辅助筛选依赖DFT计算判断候选分子与靶蛋白的结合能力,计算误差大会导致太多无效候选分子进入昂贵的实验验证环节;材料科学中,电池、催化剂、碳捕获材料的设计都需要高精度的能量计算来指导方向选择。Skala这类工具的进步,意味着同等计算投入下可以更可靠地过滤候选方案,加速有效材料和药物的发现。
当然,一些局限性值得清醒认识。Skala目前对色散(范德华力)相互作用仍依赖外部修正,尚未完全内化;对多参考体系的处理有明显局限;在强关联电子体系上的可靠性尚待验证。SCF收敛性略差于传统泛函(约1.1%的体系需要额外重试),在某些情况下需要手动干预。模型在训练数据覆盖的化学空间之外的外推能力,还需要更系统的测试。
不过,这项研究清晰地勾勒出了一条路:用大规模高精度数据驱动深度学习,可以系统性地改善交换相关泛函,而且随着数据的不断扩充,精度会持续提升。这与过去60年手工推导公式的范式不同——那条路已经越来越接近其固有局限;而这条路,还远远没有走到头。
有兴趣进一步探索的读者,可以通过arXiv编号2506.14665找到完整论文,模型权重和推断代码已以MIT许可证在微软的GitHub主页开源,也可以在Azure AI Foundry平台上直接体验Skala的在线推断服务。
Q&A
Q1:Skala泛函比传统DFT方法好在哪里?
A:Skala通过深度学习神经网络学习了电子间非局域量子效应,在不增加计算成本的前提下,把精度提升到了传统上只有更贵的混合泛函才能达到的水平。在GMTKN55主族化学基准上,Skala的加权平均误差为2.80千卡/摩尔,超越了所有主流混合泛函,而计算代价只相当于半局域泛函。
Q2:Skala能处理过渡金属体系吗?
A:目前能力有限。Skala-1.1在训练集中仅包含少量过渡金属原子数据,在某些过渡金属基准测试上能与主流泛函持平,但对复杂过渡金属分子体系的可靠性尚不足够。研究团队明确表示,要提升过渡金属精度需要大规模扩充高精度过渡金属训练数据,这是未来工作的主要方向之一。
Q3:Skala的模型代码和权重可以下载使用吗?
A:可以。Skala的模型代码和预训练权重已以MIT开源许可证发布在微软GitHub主页(github.com/microsoft/skala),支持通过PySCF、GPU4PySCF和ASE等量子化学程序调用,也可通过Azure AI Foundry平台在线使用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。