microsoft/timewarp
收藏Hugging Face2024-08-21 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/microsoft/timewarp
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含用于训练神经网络的分子动力学模拟数据,特别是用于加速分子动力学模拟的Timewarp项目。数据集包括多个小肽(2-4个氨基酸)的分子动力学轨迹,使用隐式水力场进行模拟。每个蛋白质有两个文件:`protein-state0.pdb`包含拓扑和初始3D坐标,`protein-arrays.npz`包含轨迹信息。数据集分为多个子集,包括2AA-1-big、2AA-1-complete、4AA-huge和4AA-large,分别包含不同数量和类型的肽的模拟数据。
提供机构:
microsoft
原始信息汇总
数据集概述
数据集名称
- Timewarp datasets
数据集内容
- 包含分子动力学模拟数据,用于训练NeurIPS 2023论文中的神经网络。
- 数据集由多个小肽(2-4个氨基酸)的分子动力学轨迹组成,使用隐式水力场模拟。
数据集文件结构
protein-state0.pdb: 包含拓扑结构和初始3D XYZ坐标。protein-arrays.npz: 包含轨迹信息。
数据集子集
-
2AA-1-big "Two Amino Acid" data set
- 包含380个双肽的分子动力学轨迹。
- 每个肽使用经典分子动力学模拟,水使用隐式水模型模拟。
- 轨迹每10000 MD步保存一次。
-
2AA-1-complete "Two Amino Acid" data set
- 包含所有400个双肽的分子动力学轨迹。
- 包括其他2AA数据集中缺失的肽。
-
4AA-huge "Four Amino Acid" data set, tetrapeptides
- 包含四肽的分子动力学轨迹。
- 主要用于验证和测试目的。
- 每个肽模拟1微秒。
-
4AA-large "Four Amino Acid" data set, tetrapeptides
- 包含2333个四肽的分子动力学轨迹。
- 数据集分为1500个训练集、400个验证集和433个测试集。
- 训练集中的每个肽模拟50纳秒,其他肽模拟500纳秒。
数据集用途
- 仅用于机器学习和分子动力学研究。
数据集许可证
- MIT许可证
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是Microsoft发布的分子动力学模拟数据集,包含小肽(2-4个氨基酸)的轨迹数据,用于训练Timewarp神经网络以加速分子动力学模拟。数据集分为多个子集,涵盖不同肽长度和用途(如训练、验证、测试),并包含拓扑结构和轨迹文件,仅限研究使用。
以上内容由遇见数据集搜集并总结生成



