five

nimashoghi/wbm|材料科学数据集|晶体结构数据集

收藏
hugging_face2024-07-21 更新2024-07-22 收录
材料科学
晶体结构
下载链接:
https://hf-mirror.com/datasets/nimashoghi/wbm
下载链接
链接失效反馈
资源简介:
该数据集包含多个与材料科学相关的特征,如化学式、位点数、体积、能量、带隙等。这些特征可能用于材料性质的研究和预测。数据集包含256,963个样本,总大小为725,022,713字节,下载大小为156,478,328字节。

This dataset contains multiple features related to materials science, such as chemical formula, number of sites, volume, energy, bandgap, etc. These features may be used for the study and prediction of material properties. The dataset includes 256,963 samples, with a total size of 725,022,713 bytes and a download size of 156,478,328 bytes.
提供机构:
nimashoghi
原始信息汇总

数据集概述

数据集特征

  • formula: 化学式,数据类型为字符串。
  • n_sites: 站点数量,数据类型为浮点数。
  • volume: 体积,数据类型为浮点数。
  • uncorrected_energy: 未校正的能量,数据类型为浮点数。
  • e_form_per_atom_wbm: 每原子的形成能(WBM),数据类型为浮点数。
  • e_above_hull_wbm: 高于Hull的能量(WBM),数据类型为浮点数。
  • bandgap_pbe: PBE带隙,数据类型为浮点数。
  • wyckoff_spglib_initial_structure: Wyckoff符号(初始结构),数据类型为字符串。
  • uncorrected_energy_from_cse: 从CSE获取的未校正能量,数据类型为浮点数。
  • e_correction_per_atom_mp2020: 每原子的校正能量(MP2020),数据类型为浮点数。
  • e_correction_per_atom_mp_legacy: 每原子的校正能量(MP Legacy),数据类型为浮点数。
  • e_form_per_atom_uncorrected: 每原子的未校正形成能,数据类型为浮点数。
  • e_form_per_atom_mp2020_corrected: 每原子的校正形成能(MP2020),数据类型为浮点数。
  • e_above_hull_mp2020_corrected_ppd_mp: 校正后高于Hull的能量(MP2020),数据类型为浮点数。
  • site_stats_fingerprint_init_final_norm_diff: 初始和最终结构的指纹归一化差异,数据类型为浮点数。
  • wyckoff_spglib: Wyckoff符号,数据类型为字符串。
  • unique_prototype: 是否为唯一原型,数据类型为布尔值。
  • formula_from_cse: 从CSE获取的化学式,数据类型为字符串。
  • initial_structure: 初始结构,包含以下子特征:
    • @class: 类名,数据类型为字符串。
    • @module: 模块名,数据类型为字符串。
    • charge: 电荷,数据类型为空。
    • lattice: 晶格,包含以下子特征:
      • a: a轴长度,数据类型为浮点数。
      • alpha: alpha角度,数据类型为浮点数。
      • b: b轴长度,数据类型为浮点数。
      • beta: beta角度,数据类型为浮点数。
      • c: c轴长度,数据类型为浮点数。
      • gamma: gamma角度,数据类型为浮点数。
      • matrix: 晶格矩阵,数据类型为浮点数序列。
      • volume: 晶格体积,数据类型为浮点数。
    • sites: 站点列表,包含以下子特征:
      • abc: 晶格坐标,数据类型为浮点数序列。
      • label: 标签,数据类型为字符串。
      • species: 物种列表,包含以下子特征:
        • element: 元素,数据类型为字符串。
        • occu: 占据率,数据类型为浮点数。
      • xyz: 笛卡尔坐标,数据类型为浮点数序列。
  • id: 标识符,数据类型为字符串。
  • material_id: 材料标识符,数据类型为字符串。
  • frac_pos: 分数坐标,数据类型为浮点数序列。
  • cart_pos: 笛卡尔坐标,数据类型为浮点数序列。
  • pos: 位置,数据类型为浮点数序列。
  • cell: 单元格,数据类型为浮点数序列。
  • num_atoms: 原子数量,数据类型为整数。
  • atomic_numbers: 原子序数,数据类型为整数序列。
  • composition: 组成,数据类型为整数序列。

数据集分割

  • all: 包含256963个样本,总大小为725022713字节。

数据集大小

  • 下载大小: 156478328字节。
  • 数据集大小: 725022713字节。

配置

  • default: 包含所有数据文件,路径为data/all-*
AI搜集汇总
数据集介绍
main_image_url
构建方式
nimashoghi/wbm数据集是通过对材料科学领域中的晶体结构进行系统性收集与计算构建而成。该数据集涵盖了多种晶体结构的化学式、晶格参数、能量特性等关键信息,数据来源包括计算材料学模拟和实验验证。通过结合第一性原理计算与材料数据库的交叉验证,确保了数据的准确性与可靠性。
使用方法
nimashoghi/wbm数据集的使用方法主要围绕材料科学领域的计算与分析展开。用户可以通过加载数据集,提取晶体结构信息、能量特性等关键数据,用于材料性能预测、结构优化等研究。数据集支持多种编程语言和工具的直接调用,便于集成到现有的计算流程中。此外,其标准化的数据格式也为跨平台数据共享与协作提供了便利。
背景与挑战
背景概述
nimashoghi/wbm数据集是一个专注于材料科学领域的高质量数据集,旨在为材料的结构与性能预测提供数据支持。该数据集由nimashoghi团队创建,涵盖了多种材料的晶体结构、能量特性、带隙等关键物理化学参数。数据集的核心研究问题在于如何通过计算材料学方法,准确预测材料的形成能、带隙以及结构稳定性等关键性能指标。该数据集的发布为材料科学领域的研究者提供了丰富的实验数据,推动了材料设计与发现的高效化与智能化。
当前挑战
nimashoghi/wbm数据集在解决材料性能预测问题时面临多重挑战。首先,材料的结构与性能关系复杂,涉及多尺度、多物理场的耦合问题,如何从海量数据中提取有效特征并建立高精度预测模型是一个重要难题。其次,数据集的构建过程中,晶体结构的精确描述与能量校正的计算需要极高的计算资源与算法精度,这对数据采集与处理提出了严格要求。此外,数据集中不同来源的数据可能存在不一致性,如何整合与标准化这些数据以确保其可靠性,也是构建过程中需要克服的关键挑战。
常用场景
经典使用场景
在材料科学领域,nimashoghi/wbm数据集被广泛应用于材料能量计算和结构优化研究。该数据集包含了丰富的材料结构信息,如晶格参数、原子位置和能量数据,为研究人员提供了全面的材料性能分析基础。通过该数据集,研究者能够深入探索材料的形成能、带隙以及能量校正等关键物理性质。
解决学术问题
nimashoghi/wbm数据集解决了材料科学中关于材料稳定性和能量计算的多个关键问题。通过提供精确的能量校正数据和结构信息,该数据集帮助研究者更准确地预测材料的形成能和能量稳定性,从而推动了新材料的设计与发现。此外,数据集中的带隙数据也为半导体材料的研究提供了重要参考。
实际应用
在实际应用中,nimashoghi/wbm数据集被广泛用于材料设计和筛选。通过该数据集,研究人员可以快速评估不同材料的能量稳定性和电子结构,从而优化材料性能。例如,在电池材料、催化剂和半导体器件等领域,该数据集为材料的选择和设计提供了科学依据,显著提高了研发效率。
数据集最近研究
最新研究方向
在材料科学领域,nimashoghi/wbm数据集为研究者提供了丰富的晶体结构及其能量特性数据,涵盖了从原子层面的结构信息到宏观的能量计算。近年来,该数据集在材料发现与设计中的应用尤为突出,特别是在高通量计算与机器学习结合的材料筛选方法中。研究者利用该数据集中的能量校正、带隙计算等特征,开发了新型的预测模型,以加速新材料的发现过程。此外,该数据集还支持了对材料稳定性和相图的研究,为理解材料的物理化学性质提供了重要依据。随着计算能力的提升和算法的优化,nimashoghi/wbm数据集在推动材料科学前沿研究中的作用愈发显著,成为该领域不可或缺的资源之一。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集