five

reaction_database

收藏
github2025-06-24 更新2025-06-25 收录
下载链接:
https://github.com/heid-lab/reaction_database
下载链接
链接失效反馈
官方服务:
资源简介:
反应数据库存储库包括一系列反应数据集。每个数据集都有一个`fullDataset`文件夹,包含完整的数据集,以及任何不直接由DeepReaction框架支持的分割策略的附加目录。

The Reaction Database Repository includes a collection of reaction datasets. Each dataset features a `fullDataset` folder containing the complete dataset, alongside supplementary directories for any splitting strategies not directly supported by the DeepReaction framework.
创建时间:
2025-06-23
原始信息汇总

反应数据库数据集概述

数据集列表

1. rdb7

  • 数据点数量: 11,926
  • 原始文献: 10.1038/s41597-022-01529-6
  • 理论水平: CCSD(T)-F12/cc-pVDZ-F12
  • 反应类型: 多种
  • 单位: kcal/mol
  • 坐标信息: 包含反应物、过渡态和产物坐标 (y/y/y)
  • 反向反应: 是
  • 数据存储: zenodo

2. rgd1

  • 数据点数量: 176,898
  • 原始文献: 10.1038/s41597-023-02043-z
  • 理论水平: B3LYP-D3/TZVP
  • 反应类型: 多种
  • 单位: kcal/mol
  • 坐标信息: 包含反应物、过渡态和产物坐标 (y/y/y)
  • 反向反应: 否
  • 数据存储: Figshare

3. e<sub>2</sub>

  • 数据点数量: 1,264
  • 原始文献: 10.1088/2632-2153/aba822
  • 理论水平: DF-LCCSD/cc-pVTZ
  • 反应类型: E<sub>2</sub> 反应
  • 单位: kcal/mol
  • 坐标信息: 包含反应物和过渡态坐标,不包含产物坐标 (y/y/n)
  • 反向反应: 否
  • 数据存储: Materialscloud

4. sn<sub>2</sub>

  • 数据点数量: 2,361
  • 原始文献: 10.1088/2632-2153/aba822
  • 理论水平: DF-LCCSD/cc-pVTZ
  • 反应类型: Sn<sub>2</sub> 反应
  • 单位: kcal/mol
  • 坐标信息: 包含反应物和过渡态坐标,不包含产物坐标 (y/y/n)
  • 反向反应: 否
  • 数据存储: Materialscloud
搜集汇总
数据集介绍
main_image_url
构建方式
在计算化学领域,reaction_database数据集通过系统整合多个高质量反应数据集构建而成。其核心数据来源于已发表的权威文献,采用不同理论水平的量子化学计算方法,包括CCSD(T)-F12/cc-pVDZ-F12和B3LYP-D3/TZVP等。数据集以标准化的方式存储反应物、过渡态和产物的几何构型坐标,部分数据集还包含逆向反应信息。数据采集过程严格遵循原始文献的实验设计和计算参数,确保数据的可追溯性和可重复性。
特点
该数据集最显著的特点是涵盖多种反应类型,包括E2消除反应和SN2亲核取代反应等,反应能垒数据以kcal/mol为单位统一标注。数据集规模差异较大,从1,264到176,898个数据点不等,为研究不同规模的反应网络提供了灵活性。特别值得注意的是,部分数据集包含逆向反应信息,这对研究反应可逆性具有重要价值。所有数据均存储在Zenodo、Figshare和Materialscloud等开放科学平台,保障了数据的长期可获取性。
使用方法
使用该数据集时,研究人员可通过GitHub仓库中的data文件夹获取完整数据集,其中fullDataset子目录包含未经分割的原始数据。对于需要特定分割策略的研究,可参考DeepReaction框架的兼容性说明。数据集采用表格形式组织,包含反应类型、理论水平、数据来源等元数据,便于快速筛选。建议使用者结合原始文献中的计算方法说明进行数据分析,特别注意不同数据集间理论水平的差异可能对比较研究造成的影响。
背景与挑战
背景概述
reaction_database数据集是由多个研究团队共同构建的化学反应数据库,旨在为计算化学领域提供高质量的势垒高度预测基准数据。该数据集的核心研究问题聚焦于通过高精度量子化学计算方法(如CCSD(T)-F12、B3LYP-D3等)获取各类化学反应的能垒数据,其子集rdb7和rgd1分别于2022年和2023年发表在《Scientific Data》期刊。数据集涵盖了E2消除反应、SN2亲核取代反应等多种反应类型,数据点规模从千级到十万级不等,为反应机理研究和机器学习模型开发提供了重要支撑。
当前挑战
该数据集面临的挑战主要体现在两个维度:在科学问题层面,精确预测多类型化学反应的势垒高度需要克服量子化学计算的高复杂度与计算资源消耗之间的矛盾,特别是对于过渡态结构的精确描述;在数据构建层面,不同子集采用异构的理论方法和数据存储格式(Zenodo/Figshare/Materialscloud),需解决数据标准化与跨平台整合的难题。此外,部分数据集缺乏逆向反应数据,限制了可逆反应动力学研究的完整性。
常用场景
经典使用场景
在计算化学领域,reaction_database数据集为研究者提供了丰富的反应能垒数据,特别是在研究反应机理和动力学模拟方面具有重要价值。该数据集通过收录多种反应类型的高精度计算结果,为理论化学和催化研究提供了可靠的基准数据。研究人员可以基于这些数据构建更精确的反应势能面,从而深入理解化学反应的本质。
实际应用
该数据集在工业催化剂设计和药物合成路线优化中展现出重要应用价值。制药企业可以利用其中的SN2和E2反应数据筛选最优反应条件,降低研发成本。同时,能源领域的研究者借助这些数据开发更高效的能量转换催化剂,为实现绿色化学提供了理论支持。
衍生相关工作
基于reaction_database的丰富数据,研究者已开发出DeepReaction等反应预测框架。这些工作显著提升了反应能垒预测的准确性,并催生了新的机器学习方法在计算化学中的应用。相关成果发表在Nature系列数据期刊上,为后续研究奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作