字节开源ByteQC,GPU加速量子化学计算工具集,实现大规模体系高精度模拟,助力材料等领域研究。
原文标题:大规模实用化量子化学计算曙光显现,ByteDance Research开源工具集ByteQC
原文作者:机器之心
冷月清谈:
ByteQC针对GPU显存较小和架构差异等问题,进行了多项优化:
1. 引入高效计算库cuTENSR/cuTENSORMG,优化张量缩并计算。
2. 高效实现了周期性体系屏蔽计算的动态生产者-消费者模型和Fock矩阵构建中的竞态求和。
3. 通过缓存分析和原位操作,最大限度地减少了显存占用。
基准测试显示,ByteQC在多种量子化学算法上实现了显著的加速,例如单GPU可比100核CPU快60倍。此外,ByteQC的量子嵌入功能使其能够在保持高精度的情况下计算更大规模的体系,例如包含数千轨道的分子团簇和表面吸附问题。
怜星夜思:
2、文章提到了量子嵌入方法,这种方法在实际应用中有哪些优势和局限性?
3、相比于其他量子化学计算软件,例如Gaussian、ORCA等,ByteQC有哪些独特的优势和不足?
原文内容
机器之心编辑部
真实化学体系包含大量的微观粒子,其精确的严格计算需要指数高的复杂度,对这些体系的模拟一直是材料、制药和催化等领域的难点和前沿。
为了解决这一问题,近日字节跳动 ByteDance Research 团队开发并开源了 ByteQC —— 基于 GPU 加速的大规模量子化学计算工具集。该工具集使用强大的 GPU 算力,大幅度加速了常见的量子化学算法,同时结合领域内前沿的量子嵌入方法实现了量子化学「黄金标准」精度下的大规模量子化学体系的模拟。论文以大尺寸分子团簇,表面吸附问题为例,展示了 ByteQC 在真实材料计算中的应用潜力。
-
论文链接:https://arxiv.org/abs/2502.17963
-
代码链接:https://github.com/bytedance/byteqc
ByteQC 的诸多代码实现均进行了详细的缓存分析,最大限度地实现了缓存的复用,减少了显存需求。此外大量地使用 Cupy 提供的 kernel 接口,通过 CUDA kernel 实现了原位操作,减少了显存的占用。
-
耦合簇单、双激发(CCSD):1,610 轨道
-
带微扰三重激发(CCSD (T)):1,380 轨道
-
二阶 Møller-Plesset 微扰理论(MP2):11,040 轨道
-
开放边界条件下的平均场计算:37,120 轨道
-
周期边界条件下的平均场计算:超过 100,000 轨道