five

ZeoSyn

收藏
github2024-04-10 更新2024-05-31 收录
下载链接:
https://github.com/eltonpan/zeosyn_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ZeoSyn是一个包含23,961个沸石合成路线的大型数据集,涵盖233种沸石拓扑结构和921种有机结构导向剂。每个独特的合成路线包含一系列关键合成参数,如凝胶组成、反应条件、有机结构导向剂和最终的沸石产品。

ZeoSyn is a comprehensive dataset comprising 23,961 zeolite synthesis routes, encompassing 233 distinct zeolite topologies and 921 organic structure-directing agents. Each unique synthesis route includes a series of critical synthesis parameters, such as gel composition, reaction conditions, organic structure-directing agents, and the final zeolite product.
创建时间:
2023-09-16
原始信息汇总

数据集概述

ZeoSyn 是一个包含 23,961 条沸石合成路线的综合数据集,涵盖了 233 种沸石拓扑结构和 921 种有机结构导向剂(OSDAs)。每条合成路线包含以下关键合成参数:

  1. 凝胶组成(杂原子、矿化剂和水之间的摩尔比)
  2. 反应条件(结晶/老化温度和时间)
  3. 有机结构导向剂(SMILES表示)
  4. 最终的沸石产品(3字母IZA代码)

数据集详细信息

A) 概览

  • 图示:展示了沸石合成路线的示例,包括凝胶组成、无机前体、反应条件、有机结构导向剂(OSDA)以及最终的沸石框架。
  • 元素频率:数据集中元素的频率分布,以对数形式表示。
  • 合成路线数量:根据孔径大小分类的沸石合成路线数量随时间的变化,以及关键凝胶组成变量的分布。

B) 沸石框架

  • 分类:根据最大环尺寸将沸石框架分为小(8MR)、中(10MR)、大(12MR)和超大孔(>12MR)四类。
  • 分布:数据集中各类沸石框架的合成路线数量分别为5250、5494、5769和716。

C) 有机结构导向剂

  • 层次聚类:展示了前50个最频繁OSDAs的层次聚类,以及它们与沸石最大内含球和分子体积的正相关关系。

D) SHAP分析

  • 框架级别:揭示了影响特定框架形成的10个最重要的合成参数。
  • CBU级别:展示了影响大型CBU形成的OSDA参数。

数据集文件

  • ZEOSYN.xlsx:ZeoSyn数据集
  • osda_descriptors.csv:有机结构导向剂的描述符
  • zeolite_descriptors.csv:沸石框架的描述符
搜集汇总
数据集介绍
main_image_url
构建方式
ZeoSyn数据集通过系统性地整合了23,961条沸石合成路径,涵盖了233种沸石拓扑结构和921种有机结构导向剂(OSDAs)。每条合成路径详细记录了关键的合成参数,包括凝胶组成(异质原子、矿化剂和水的摩尔比)、反应条件(结晶/老化温度和时间)、有机结构导向剂的SMILES表示以及最终沸石产品的3字母IZA代码。这些数据来源于广泛的文献研究,确保了数据集的全面性和可靠性。
使用方法
使用ZeoSyn数据集时,用户可以通过克隆GitHub仓库并设置Conda环境来访问数据。数据集提供了详细的Jupyter Notebook演示,用户可以在Google Colab中快速上手。数据集的分类器和可视化工具可以帮助用户深入理解沸石合成的关键参数和结构关系。此外,用户还可以通过预计算的SHAP值加速分析过程,从而更高效地进行模型训练和验证。
背景与挑战
背景概述
ZeoSyn数据集是由麻省理工学院材料科学与工程系、化学工程系以及西班牙ITQ-UPV研究所的跨学科团队共同创建的,旨在通过机器学习方法优化沸石合成的水热参数。该数据集于2024年发布,包含23,961条沸石合成路径,涵盖233种沸石拓扑结构和921种有机结构导向剂(OSDAs)。每条合成路径详细记录了凝胶组成、反应条件、有机结构导向剂及其对应的沸石产物,为沸石合成领域的研究提供了丰富的数据支持。ZeoSyn的发布不仅推动了沸石合成过程的理性化设计,还为材料科学领域的机器学习应用提供了宝贵的资源。
当前挑战
ZeoSyn数据集面临的挑战主要集中在数据复杂性和合成过程的多样性上。首先,沸石合成涉及多种复杂的化学反应条件和凝胶组成,如何准确捕捉这些参数对沸石结构的影响是一个巨大的挑战。其次,有机结构导向剂的多样性和其在合成中的作用机制尚不完全明确,这增加了模型训练的难度。此外,沸石合成过程中可能出现的竞争相和共生结构问题,也为数据集的构建和分析带来了额外的复杂性。最后,如何通过机器学习模型有效揭示沸石结构与合成参数之间的深层关系,仍需进一步的研究和验证。
常用场景
经典使用场景
ZeoSyn数据集在沸石合成领域中具有经典的使用场景,主要用于通过机器学习方法对水热合成参数进行合理化分析。该数据集包含了23,961条沸石合成路径,涵盖了233种沸石拓扑结构和921种有机结构导向剂(OSDAs)。每条合成路径详细记录了凝胶组成、反应条件、有机结构导向剂及其对应的沸石产品。通过这些数据,研究者可以构建预测模型,优化沸石合成过程,从而提高合成效率和产品纯度。
解决学术问题
ZeoSyn数据集解决了沸石合成领域中长期存在的合成参数优化问题。传统上,沸石合成依赖于试错法,效率低下且成本高昂。该数据集通过整合大量合成数据,使得机器学习模型能够识别关键合成参数与沸石结构之间的复杂关系,从而实现合成过程的合理化设计。这不仅提高了合成效率,还为新型沸石材料的开发提供了理论支持,具有重要的学术价值和应用前景。
实际应用
ZeoSyn数据集在实际应用中具有广泛的应用场景,特别是在工业催化、吸附分离和气体存储等领域。通过优化沸石合成参数,可以显著提高沸石材料的性能,如催化活性、选择性和稳定性。此外,该数据集还可用于开发新型沸石材料,以满足特定工业需求,如高效催化剂、选择性吸附剂和气体存储材料。这些应用不仅提升了工业生产效率,还推动了绿色化学的发展。
数据集最近研究
最新研究方向
在材料科学领域,ZeoSyn数据集的最新研究方向主要集中在利用机器学习技术对沸石合成过程中的水热参数进行理性化分析。该数据集包含了23,961条沸石合成路径,涵盖了233种沸石拓扑结构和921种有机结构导向剂(OSDAs),为研究者提供了丰富的合成参数和结果数据。通过SHAP分析,研究者能够揭示关键的合成参数与沸石结构之间的关系,从而优化合成策略。这一研究不仅推动了沸石合成领域的理论发展,还为工业应用中的高效沸石材料制备提供了新的可能性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作