xpanceo-team/materials-project-25k
收藏Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/xpanceo-team/materials-project-25k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含材料科学领域的数据,涵盖了材料ID、结构、空间群号、晶体系统、能量相关参数(如每个原子的能量、形成能、反应能等)、磁性相关参数(如总磁化强度、磁性位点数量等)以及其他物理性质(如带隙、体积模量等)。数据集分为训练集、验证集和测试集,分别包含16875、1875和6250个样本。下载大小为68680609字节,数据集大小为219072080字节。
该数据集包含材料科学领域的数据,涵盖了材料ID、结构、空间群号、晶体系统、能量相关参数(如每个原子的能量、形成能、反应能等)、磁性相关参数(如总磁化强度、磁性位点数量等)以及其他物理性质(如带隙、体积模量等)。数据集分为训练集、验证集和测试集,分别包含16875、1875和6250个样本。下载大小为68680609字节,数据集大小为219072080字节。
提供机构:
xpanceo-team
原始信息汇总
数据集特征概述
基本特征
- material_id: 字符串类型
- structure: 字符串类型
- deprecated: 布尔类型
- space_group_number: 整数类型(int64)
- crystal_system: 字符串类型
- uncorrected_energy_per_atom: 浮点数类型(float64)
- energy_per_atom: 浮点数类型(float64)
- formation_energy_per_atom: 浮点数类型(float64)
- energy_above_hull: 浮点数类型(float64)
- is_stable: 布尔类型
- equilibrium_reaction_energy_per_atom: 浮点数类型(float64)
- decomposes_to: 字符串类型
- xas: 字符串类型
- band_gap: 浮点数类型(float64)
- cbm: 浮点数类型(float64)
- vbm: 浮点数类型(float64)
- efermi: 浮点数类型(float64)
- is_gap_direct: 布尔类型
- is_metal: 布尔类型
- es_source_calc_id: 字符串类型
- bandstructure: 字符串类型
- dos: 字符串类型
- is_magnetic: 布尔类型
- ordering: 字符串类型
- total_magnetization: 浮点数类型(float64)
- total_magnetization_normalized_vol: 浮点数类型(float64)
- total_magnetization_normalized_formula_units: 浮点数类型(float64)
- num_magnetic_sites: 浮点数类型(float64)
- num_unique_magnetic_sites: 浮点数类型(float64)
- types_of_magnetic_species: 字符串类型
- bulk_modulus: 字符串类型
- shear_modulus: 字符串类型
- universal_anisotropy: 浮点数类型(float64)
- homogeneous_poisson: 浮点数类型(float64)
- e_total: 浮点数类型(float64)
- e_ionic: 浮点数类型(float64)
- e_electronic: 浮点数类型(float64)
- n: 浮点数类型(float64)
- e_ij_max: 浮点数类型(float64)
- possible_species: 序列类型(字符串)
- theoretical: 布尔类型
- index_level_0: 整数类型(int64)
数据集分割
- train: 16875个样本,占用147690931字节
- valid: 1875个样本,占用16663478字节
- test: 6250个样本,占用54717671字节
数据集大小
- 下载大小: 68680609字节
- 数据集总大小: 219072080字节
配置
- 默认配置: 包含训练、验证和测试数据集的文件路径配置。



