five

ForceASR_plaid_1.0

收藏
Hugging Face2026-05-31 更新2026-06-01 收录
下载链接:
https://huggingface.co/datasets/fabiencasenave/ForceASR_plaid_1.0
下载链接
链接失效反馈
官方服务:
资源简介:
ForceASR数据集是一个用于物理学习和几何学习的图机器学习数据集,专注于脆性断裂的相场断裂模型模拟。该数据集通过物理仿真生成,是初始数据集res-SENS子集的标准化版本,时间步长缩减为原始的五分之一,并使用PLAID格式进行封装以提供统一的访问接口,数据内容保持不变。数据集规模为28个样本,总大小约3.4GB。数据集结构复杂,包含两大类特征:1) 几何与网格特征:定义了计算区域的网格结构,包括节点坐标(CoordinateX, CoordinateY)、四节点四边形单元的连接关系(ElementConnectivity)和范围(ElementRange),以及材料标识(materialID)。2) 物理场与全局量特征:记录了节点上的物理场变量,如X和Y方向的位移(Displacement_X, Displacement_Y)以及相场(PhaseField);同时包含全局物理量,如应变能、总能量、断裂能以及X和Y方向的作用力。值得注意的是,大多数核心特征都伴随一个对应的`_times`特征(例如Displacement_X_times, PhaseField_times),这明确表明该数据集包含了时间演化数据,适用于动态或瞬态过程的建模与分析。数据集适用于图神经网络在物理模拟、材料断裂预测、时空数据建模等任务上的训练与评估。

The ForceASR dataset is a graph machine learning dataset for physics and geometry learning, focusing on phase-field fracture model simulations of brittle fracture. It is generated through physical simulations, serving as a standardized version of the initial dataset res-SENS subset, with the time step reduced to one-fifth of the original and encapsulated in PLAID format to provide a unified access interface, while the data content remains unchanged. The dataset scale is 28 samples, with a total size of approximately 3.4GB. The dataset structure is complex, comprising two main categories of features: 1) Geometric and mesh features: define the grid structure of the computational region, including node coordinates (CoordinateX, CoordinateY), connectivity and range of four-node quadrilateral elements (ElementConnectivity and ElementRange), and material identifiers (materialID). 2) Physical field and global quantity features: record physical field variables at nodes, such as displacements in the X and Y directions (Displacement_X, Displacement_Y) and the phase field (PhaseField); also include global physical quantities like strain energy, total energy, fracture energy, and forces in the X and Y directions. Notably, most core features are accompanied by a corresponding `_times` feature (e.g., Displacement_X_times, PhaseField_times), clearly indicating that the dataset contains temporal evolution data, suitable for modeling and analysis of dynamic or transient processes. The dataset is applicable for training and evaluation of graph neural networks in tasks such as physical simulation, material fracture prediction, and spatiotemporal data modeling.
创建时间:
2026-05-25
原始信息汇总

数据集概览

数据集名称: ForceASR dataset

许可证: CC-BY-4.0

任务类别: 图机器学习 (graph-ml)

标签: 物理学习、几何学习


数据内容与结构

  • 物理背景: 模拟脆性断裂的相场断裂模型 (phase-field fracture models for brittle fracture)
  • 数据来源: 仿真模拟产生
  • 处理说明: 为原始数据集的一个子集 (res-SENS 子集),仅保留1/5的时间步长,并转换为 PLAID 格式以实现标准化访问,数据内容未做修改。
  • 样本数量: res_SENS 分割包含 28 个样本

数据特征

数据集包含丰富的结构化特征,主要包括:

  • 网格坐标: CoordinateX, CoordinateY (float32)
  • 网格元素: 单元连接性 (ElementConnectivity, int64)、单元范围 (ElementRange, int64)
  • 顶点场量: 位移 (Displacement_X, Displacement_Y),相位场量 (PhaseField),材料ID (materialID) (均为 float32)
  • 全局变量: 构型信息 (config, string)、断裂能 (fracture energy, float32)、参考频率 (fref, float32)、相场阈值 (pfThres, float32)、应变能 (strain energy, float32)、总能量 (total energy, float32)、x/y方向力 (x-force, y-force) (均为 float32)
  • 大部分场量均伴随对应的时间变量 (以 _times 后缀标识,类型为 float64)

数据集划分

  • 唯一分割: res_SENS
分割名称 样本数 数据量 (bytes)
res_SENS 28 3,436,764,335

总下载大小: 3,437,057,466 bytes

数据存储与访问

数据集由 plaid 库生成,推荐通过 PLAID 的 API 进行访问。支持以下访问方式:

  • 完整下载到本地: 使用 plaid.storage.download_from_hub 下载后再实例化样本
  • 流式读取: 使用 plaid.storage.init_streaming_from_hub 进行流式加载
  • 直接使用 Hugging Face datasets: 对于熟悉 datasets 库的用户,可直接通过 load_dataset 获取原始数据,但需注意原始数据仅包含变量特征,且时间变量有特定编码

法律与版权信息

  • 数据所有者: RK 2423 FRASCAL (原始数据存储于 Zenodo,记录ID: 7445749)
  • 使用许可: CC-BY-4.0
搜集汇总
数据集介绍
main_image_url
构建方式
ForceASR_plaid_1.0数据集的构建基于先进的计算断裂力学模拟,采用相场断裂模型对脆性材料的断裂行为进行数值仿真。原始仿真数据经过精心处理,仅保留原始数据集中1/5的时间步长,形成名为'res_SENS'的子集。随后,这些数据被转换为标准化PLAID格式,以确保跨平台访问的一致性与便捷性,而数据内容本身未作任何修改。该数据集共计包含28个样本,每个样本记录了从网格几何、节点位移到场变量(如相场、材料ID)在内的丰富时空信息,并通过Hugging Face Datasets框架进行存储与分发。
特点
该数据集的核心特色在于其结构化、标准化的物理场数据表示。每个样本均包含有限元网格的节点坐标(CoordinateX、CoordinateY)、位移场(Displacement_X、Displacement_Y)、以及材料属性与损伤演化的关键场变量(如PhaseField、materialID、fracture energy等)。尤为重要的是,所有时变特征均附有对应的时间戳(_times字段),使其天然适合于时序建模与物理信息学习。数据集遵循CC-BY-4.0许可协议,来源可追溯至Zenodo官方记录,保障了数据的合法性与可复用性。其存储后端为hf_datasets,便于与Hugging Face生态系统无缝集成。
使用方法
用户可通过两种主要途径使用该数据集。推荐方式是利用专用库plaid,首先调用download_from_hub函数将数据下载至本地,再通过init_from_disk与converter.to_plaid方法将原始数据实例化为plaid_sample对象,从而便捷地按时间步访问各输入与输出特征。此外,高级用户亦可直接采用Hugging Face的datasets库,通过load_dataset接口加载原始数据,此时数据以特征字典形式呈现,包含编码后的时变数组。对于更深入的元数据提取,可借助load_problem_definitions_from_disk或load_problem_definitions_from_hub函数获取问题定义,进而遍历所有时间步与特征路径。
背景与挑战
背景概述
ForceASR_plaid_1.0数据集由RK 2423 FRASCAL团队于2023年创建,基于Zenodo(7445749)发布的初始模拟数据,旨在为脆性断裂的相场断裂模型研究提供标准化、可复用的数据资源。该数据集聚焦于物理仿真与几何学习领域,通过PLAID格式(一种专为科学数据设计的标准化存储格式)对原始仿真结果进行重组织,保留了从弹性变形到裂纹扩展全过程的高保真物理场信息,包括位移场、相场、应变能等关键变量。作为连接计算力学与数据驱动方法的桥梁,该数据集对于推动基于深度学习的断裂预测、材料失效分析及多物理场代理模型的发展具有重要意义,为相关领域的研究者提供了高质量、易访问的基准数据。
当前挑战
该数据集所解决的领域核心挑战在于脆性断裂数值模拟的高计算代价与数据可获取性不足——传统相场模型需要精细网格和时间步长,导致大规模参数扫描和不确定性量化极难实现。构建过程中面临的挑战包括:从原始大规模仿真中提取并保存多时间步的多场数据(如节点位移、单元连通性等),并转换成PLAID格式以确保数据完整性和标准化访问,同时仅保留1/5时间步以平衡数据量与信息完整性。此外,数据集仅包含28个仿真样本(res_SENS划分),样本量有限,对模型泛化性和过拟合风险构成考验,未来需通过扩展样本空间或数据增强来缓解这一问题。
常用场景
经典使用场景
ForceASR_plaid_1.0数据集作为物理信息驱动图机器学习领域的标杆资源,其核心应用场景聚焦于脆性断裂相场模型的数值模拟与数据驱动学习。该数据集收录了28组基于相场断裂力学理论的高保真有限元模拟结果,涵盖了从二维网格坐标、单元连通性到节点位移、相场变量及材料属性等完整时空演化信息。研究者可借此构建基于图神经网络(GNN)的代理模型,实现对裂纹萌生、扩展路径及分叉行为的高效预测,从而突破传统数值方法在复杂断裂问题上的计算瓶颈。
实际应用
在工程实践层面,该数据集为结构健康监测、材料失效分析及多尺度断裂力学设计提供了技术支撑。借助该数据集训练的机器学习模型可快速预测材料在复杂载荷下的裂纹演化行为,服务于航空发动机叶片、压力容器及核设施等关键构件的寿命评估。同时,数据集采用标准化的PLAID格式,便于与主流工业仿真软件对接,加速了物理仿真与数据驱动方法的耦合,为数字孪生框架中的实时断裂预测提供了可靠的数据基石。
衍生相关工作
该数据集催生了一系列聚焦于物理引导图网络与神经算子方法的代表性研究。例如,基于其时空网格数据,研究者发展了融合相场先验的等变图神经网络架构,实现了对裂纹拓扑结构的几何感知预测。同时,针对多时间步数据特性,衍生出基于时序卷积与注意力机制的断裂演化模型。此外,该数据集还被用于评估物理信息损失函数在非连续问题中的有效性,推动了守恒型神经网络与混合数值-数据驱动方法的发展,丰富了计算力学中机器学习工具集的构建范式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作