five

microsoft/timewarp

收藏
Hugging Face2024-08-21 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/microsoft/timewarp
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含用于训练神经网络的分子动力学模拟数据,特别是用于加速分子动力学模拟的Timewarp项目。数据集包括多个小肽(2-4个氨基酸)的分子动力学轨迹,使用隐式水力场进行模拟。每个蛋白质有两个文件:`protein-state0.pdb`包含拓扑和初始3D坐标,`protein-arrays.npz`包含轨迹信息。数据集分为多个子集,包括2AA-1-big、2AA-1-complete、4AA-huge和4AA-large,分别包含不同数量和类型的肽的模拟数据。
提供机构:
microsoft
原始信息汇总

数据集概述

数据集名称

  • Timewarp datasets

数据集内容

  • 包含分子动力学模拟数据,用于训练NeurIPS 2023论文中的神经网络。
  • 数据集由多个小肽(2-4个氨基酸)的分子动力学轨迹组成,使用隐式水力场模拟。

数据集文件结构

  • protein-state0.pdb: 包含拓扑结构和初始3D XYZ坐标。
  • protein-arrays.npz: 包含轨迹信息。

数据集子集

  1. 2AA-1-big "Two Amino Acid" data set

    • 包含380个双肽的分子动力学轨迹。
    • 每个肽使用经典分子动力学模拟,水使用隐式水模型模拟。
    • 轨迹每10000 MD步保存一次。
  2. 2AA-1-complete "Two Amino Acid" data set

    • 包含所有400个双肽的分子动力学轨迹。
    • 包括其他2AA数据集中缺失的肽。
  3. 4AA-huge "Four Amino Acid" data set, tetrapeptides

    • 包含四肽的分子动力学轨迹。
    • 主要用于验证和测试目的。
    • 每个肽模拟1微秒。
  4. 4AA-large "Four Amino Acid" data set, tetrapeptides

    • 包含2333个四肽的分子动力学轨迹。
    • 数据集分为1500个训练集、400个验证集和433个测试集。
    • 训练集中的每个肽模拟50纳秒,其他肽模拟500纳秒。

数据集用途

  • 仅用于机器学习和分子动力学研究。

数据集许可证

  • MIT许可证
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是Microsoft发布的分子动力学模拟数据集,包含小肽(2-4个氨基酸)的轨迹数据,用于训练Timewarp神经网络以加速分子动力学模拟。数据集分为多个子集,涵盖不同肽长度和用途(如训练、验证、测试),并包含拓扑结构和轨迹文件,仅限研究使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作