GROMACS Dataset and LAMMPS Dataset
收藏github2025-06-04 更新2025-06-05 收录
下载链接:
https://github.com/LiangJiuyang/Ewald-Splitting-with-Prolates
下载链接
链接失效反馈官方服务:
资源简介:
GROMACS数据集包含用于溶菌酶蛋白、跨膜牛bc1复合物和锂离子水电解质的GROMACS输入文件。LAMMPS数据集包含用于SPC/E体水系统的LAMMPS输入文件。
The GROMACS dataset includes GROMACS input files for lysozyme protein, transmembrane bovine bc1 complex, and lithium-ion electrolyte. The LAMMPS dataset contains LAMMPS input files for the SPC/E water system.
创建时间:
2025-05-12
原始信息汇总
Ewald-Splitting-with-Prolates 数据集概述
数据集来源
- 数据集地址:https://github.com/LiangJiuyang/Ewald-Splitting-with-Prolates
数据集内容
1. LAMMPS 分子动力学软件分支
- 位置:
LAMMPS/文件夹 - 描述:包含 LAMMPS 分子动力学软件的分支版本,该分支针对 ESP(Ewald summation with prolate spheroidal wave functions)方法进行了定制修改。
- 主要贡献者:
- Jiuyang Liang
- Libin Lu
- Alex Barnett
- Leslie Greengard
- Shidong Jiang
2. GROMACS 数据集
- 包含三个子数据集:
- LysoProtein/: 包含溶菌酶蛋白质的 GROMACS 输入文件。
- Transmembrane/: 包含跨膜牛 bc1 复合物的 GROMACS 输入文件。这些文件从 MemProt MD 下载,并针对当前版本的 GROMACS 进行了轻微修改。
- Li-ion-Electrolyte/: 包含锂离子水电解质的 GROMACS 输入文件。
3. LAMMPS 数据集
- LAMMPS-Water/: 包含 SPC/E 块状水系统的 LAMMPS 输入文件。系统被复制 11 倍和 34 倍,生成包含 3,597,693 和 106,238,712 个原子的更大系统。
快速开始指南
在 LAMMPS 中使用 ESP 方法
-
编译过程: bash mkdir LAMMPS/build cd LAMMPS/build cmake -C ../cmake/presets/oneapi.cmake -D PKG_RIGID=on -D PKG_MOLECULE=on -D PKG_KSPACE=on ../cmake make install make -j 4
-
输入文件配置:
-
使用 PPPM 方法:
pair_style lj/cut/coul/long 10 6 kspace_style pppm 1e-4
-
使用 PSWF 方法:
pair_style lj/cut/coul/ps 10 6 kspace_style ppps 1e-4 1e-4
-
指定傅里叶网格和扩散点数:
kspace_modify mesh 100 100 100 order 4
-
支持参数范围:
- 阶数:2 到 8
- 扩散/分裂精度:1e-7 到 1e-1
-
在 GROMACS 中使用 ESP 方法
- 待完成。
联系方式
- Jiuyang Liang: jliang@flatironinstitute.org
- Libin Lu: llu@flatironinstitute.org
搜集汇总
数据集介绍

构建方式
该数据集构建于分子动力学模拟领域,通过定制化修改LAMMPS和GROMACS两大主流软件实现ESP方法(椭球面波函数Ewald求和)。LAMMPS分支采用cmake编译框架集成RIGID、MOLECULE等核心模块,GROMACS部分则基于溶菌酶蛋白、跨膜牛bc1复合物和锂离子电解质三类生物分子体系,其跨膜蛋白数据源自MemProt MD数据库并进行了mdp参数适配。大规模水系统通过11倍和34倍复制构建了包含数百万至亿级原子的测试体系。
特点
数据集创新性地实现了基于椭球面波函数的快速Ewald求和方法,支持2-8阶傅里叶网格展开与1e-7至1e-1精度范围的参数配置。其LAMMPS模块提供PPPM与PSWF两种算法对比接口,GROMACS部分涵盖从生物大分子到电解质的多元体系。特别设计的3.6亿原子超大规模水系统为并行计算性能评估提供了理想基准,跨膜蛋白数据经过版本兼容性优化,体现了计算生物学与材料科学的交叉需求。
使用方法
使用LAMMPS模块需通过cmake启用RIGID、MOLECULE和KSPACE编译选项,输入文件通过pair_style指定截断半径,kspace_style切换PPPM/PSWF算法。网格参数通过kspace_modify动态调节,支持三维网格尺寸与展开阶数设定。GROMACS部分待补充完整使用文档,当前提供预配置的mdp拓扑文件可直接用于主流版本模拟。研究人员可通过修改示例文件的精度参数与体系规模,快速验证ESP方法在长程静电作用计算中的性能优势。
背景与挑战
背景概述
GROMACS与LAMMPS数据集诞生于分子动力学模拟领域对高效长程静电相互作用计算方法的迫切需求,由Flatiron研究所的Jiuyang Liang、Libin Lu等学者主导开发,其核心创新在于引入椭球面波函数(PSWF)的Ewald求和方法(ESP)。该数据集通过提供经过特殊优化的蛋白质、跨膜复合物及电解质体系输入文件,显著提升了大规模生物分子体系模拟的精度与效率,为计算生物物理学和材料科学领域的研究者提供了关键工具。数据集内嵌的跨版本兼容性设计,进一步增强了其在多尺度模拟研究中的普适价值。
当前挑战
该数据集面临双重挑战:在科学层面,需解决传统PPPM算法处理非均匀电荷分布体系时精度衰减的问题,而ESP方法需验证其在超大规模体系(如亿级原子系统)中的计算稳定性;在技术实现上,代码重构需平衡并行计算效率与算法复杂度,特别是GROMACS模块的GPU加速适配尚未完成。此外,跨膜蛋白体系输入文件的参数优化涉及生物膜环境复杂相互作用的精确建模,这对力场参数化提出了更高要求。
常用场景
经典使用场景
在分子动力学模拟领域,GROMACS和LAMMPS数据集为研究者提供了高度优化的输入文件配置,特别适用于复杂生物分子系统和电解质的模拟。例如,LysoProtein文件夹中的溶菌酶蛋白输入文件,能够精确模拟蛋白质在水溶液中的动力学行为,为理解蛋白质折叠和相互作用机制提供了可靠工具。Transmembrane文件夹中的跨膜蛋白输入文件,则专门用于研究膜蛋白在脂质双分子层中的构象变化和功能机制。
衍生相关工作
基于该数据集衍生的经典工作包括对ESP算法的进一步优化及其在生物分子模拟中的扩展应用。例如,研究者利用该数据集开发了更高效的并行计算策略,以支持超大规模分子系统的模拟。此外,跨膜蛋白模拟文件还被用于研究脂质-蛋白质相互作用,推动了膜蛋白功能机制的深入探索。
数据集最近研究
最新研究方向
在分子动力学模拟领域,GROMACS和LAMMPS数据集的最新研究方向聚焦于基于扁长椭球波函数的Ewald求和方法(ESP)的优化与应用。这一方法通过改进传统的PPPM算法,显著提升了长程静电相互作用的计算精度和效率,尤其在处理大规模生物分子系统和电解质溶液时表现出优越性能。近期研究热点包括将该技术应用于跨膜蛋白复合物、离子电解质体系等复杂系统,以解决传统方法在网格划分和计算精度上的瓶颈问题。这些进展为药物设计、材料科学等领域的分子模拟提供了更高效的工具,推动了高性能计算在生命科学中的应用边界。
以上内容由遇见数据集搜集并总结生成



