DynoDB
收藏Hugging Face2025-11-20 更新2025-11-21 收录
下载链接:
https://huggingface.co/datasets/RPDGroup/DynoDB
下载链接
链接失效反馈官方服务:
资源简介:
这个数据集包含了8385个小蛋白质的全原子分子动力学模拟轨迹,每个轨迹包含1000个集合框架,用于系统地描述小蛋白质在原子尺度上的动态构象变化。
创建时间:
2025-11-12
原始信息汇总
DynoDB 数据集概述
数据集简介
DynoDB 是一个包含小蛋白质构象集合的数据库,通过全原子分子动力学模拟生成,系统性地表征小蛋白质在原子尺度上的动态构象变化。
数据集规模
- 轨迹数量:8,385
- 单轨迹长度:100 ns
- 累计模拟时间:838.5 µs
- 原子总数:3,990,516
- 平均系统大小(原子):约476
- 残基总数:491,395
- 平均系统大小(残基):约59
- 存储大小:约570.5GB
数据内容
- 每个轨迹包含1,000个集合帧
- 涵盖小蛋白质的分子动力学轨迹
许可信息
- 许可证:GPL-3.0
引用要求
使用 DynateinDB 数据集的研究论文需引用相关手稿。
搜集汇总
数据集介绍

构建方式
在结构生物学研究领域,DynoDB数据集的构建采用了全原子分子动力学模拟方法,系统生成了8,385条蛋白质动态轨迹。每条轨迹模拟时长为100纳秒,累计模拟时间达到838.5微秒,覆盖了约476个原子和59个残基的平均系统规模。通过精确的力场参数和溶剂环境设置,该数据集以原子级分辨率捕捉了小蛋白质构象变化的动态过程。
特点
该数据集的核心特征体现在其大规模系统性,共包含超过399万个原子和49万残基的结构信息。每个蛋白质轨迹由1,000个构象帧组成,以570.5GB的存储空间完整记录了蛋白质构象空间的动态演化。这种高时空分辨率的特性使其成为研究蛋白质动力学和构象异质性的重要资源。
使用方法
研究人员可通过访问存储的分子动力学轨迹文件,利用专业分析工具进行构象聚类、自由能面计算等研究。该数据集适用于开发机器学习模型预测蛋白质动态行为,或验证理论模拟方法的准确性。使用时应遵循GPL-3.0许可协议,并在相关研究中引用原始文献以保障学术规范性。
背景与挑战
背景概述
在结构生物学领域,精确表征蛋白质动态构象变化对理解其功能机制至关重要。DynoDB数据库由研究团队于近年创建,通过全原子分子动力学模拟系统构建了8,385个小蛋白的构象集合。该数据集累计模拟时长达到838.5微秒,覆盖近400万原子体系,为揭示原子尺度下蛋白质动态行为提供了高精度计算实验数据,显著推动了蛋白质动力学研究与药物设计领域的融合发展。
当前挑战
该数据集致力于解决蛋白质构象采样与动态预测的核心难题,其构建面临多重挑战:全原子模拟需要平衡计算精度与资源消耗,百万级原子轨迹的数据存储与处理对计算架构提出极高要求;同时,如何从千帧轨迹中有效提取具有生物学意义的构象特征,仍需开发新型分析算法以突破传统静态结构研究的局限。
常用场景
经典使用场景
在结构生物学领域,DynoDB数据集被广泛应用于研究小蛋白质的动态构象变化。通过提供8,385条全原子分子动力学轨迹,该数据集使研究人员能够深入分析蛋白质在原子尺度上的柔性行为,揭示其构象集合的多样性和动态特性,为理解蛋白质功能机制提供了关键数据支持。
衍生相关工作
基于DynoDB丰富的动态结构数据,已衍生出多项重要研究工作。这些研究主要集中在开发新型构象采样算法、改进蛋白质结构预测模型,以及建立构象动态性与功能关联的新理论框架,为计算结构生物学领域注入了新的发展动力。
数据集最近研究
最新研究方向
在结构生物学领域,DynoDB数据库以其全面的小蛋白质分子动力学轨迹数据,正推动蛋白质构象动力学研究的前沿发展。该数据集通过全原子模拟捕捉微观尺度的动态变化,为理解蛋白质折叠机制和功能调控提供了关键见解。当前研究热点聚焦于利用深度学习模型预测构象转变路径,结合AlphaFold等工具探索动态结构与生物功能关联。这些进展不仅加速了药物靶点识别,还为设计新型蛋白质疗法奠定了理论基础,在计算生物物理领域产生深远影响。
以上内容由遇见数据集搜集并总结生成



