Mechanical MNIST Cahn-Hilliard
收藏arXiv2022-07-18 更新2024-06-21 收录
下载链接:
https://open.bu.edu/handle/2144/43971
下载链接
链接失效反馈官方服务:
资源简介:
Mechanical MNIST Cahn-Hilliard数据集由波士顿大学机械工程系创建,包含104,813个基于Cahn-Hilliard方程的二维异质输入模式及其相关的有限元模拟结果。该数据集通过解决非线性时空四阶偏微分方程生成,用于描述相分离过程,特别适用于异质生物材料的建模。数据集的创建旨在通过机器学习模型更深入地探索与异质材料相关的巨大输入参数空间,并解决在组织应用中可用示例有限的问题。该数据集的应用领域包括生物力学行为建模、手术模拟、患者特异性程序规划等。
The Mechanical MNIST Cahn-Hilliard Dataset was created by the Department of Mechanical Engineering, Boston University. It contains 104,813 two-dimensional heterogeneous input patterns based on the Cahn-Hilliard equation and their corresponding finite element simulation results. Generated by solving the nonlinear spatiotemporal fourth-order partial differential equation, this dataset is used to describe phase separation processes and is particularly suitable for modeling heterogeneous biomaterials. The dataset was developed to enable machine learning models to more deeply explore the vast input parameter space associated with heterogeneous materials, and to address the challenge of limited available examples in tissue-related applications. Its application scenarios include biomechanical behavior modeling, surgical simulation, patient-specific procedure planning, and more.
提供机构:
波士顿大学机械工程系
创建时间:
2022-03-09
搜集汇总
数据集介绍

构建方式
Mechanical MNIST Cahn-Hilliard数据集的构建源于对生物软组织异质性的建模需求。其输入图案基于Cahn-Hilliard方程生成,该方程描述了二元混合物的相分离过程,通过求解非线性时空四阶偏微分方程,获得具有斑点和条纹两种形态的浓度分布图案。研究团队利用开源有限元软件FEniCS运行了2,072次相分离模拟,在不同初始浓度、网格尺寸、界面厚度和自由能函数参数下,记录了105,427个空间分布图案,并存储为400×400的二进制位图。随后,将这些图案转化为两种材料的网格域,采用可压缩Neo-Hookean材料模型,在FEniCS中进行等双轴拉伸有限元模拟,最终得到包含104,813个模拟结果的数据集,每个结果记录了应变能变化、反作用力和全场位移等输出。
特点
该数据集的核心特点在于其图案的生物学相关性与多样性。输入图案源自图灵形态发生模型,模拟了生物发育中常见的斑点和条纹结构,更贴近真实生物软组织的微结构特征。通过UMAP降维可视化,图案在二维空间中形成两个清晰簇,对应两种定性形态。数据集规模庞大,包含104,813个有限元模拟结果,每个模拟涵盖从微扰到50%大变形的七个加载步,输出包括标量(应变能变化)和全场(位移)量。此外,数据集还提供了低 fidelity 版本(粗网格、微扰位移),便于迁移学习研究,其计算成本仅为高 fidelity 版本的0.08%。
使用方法
该数据集主要用于训练深度学习元模型,以快速预测异质材料的力学行为。用户可将64×64的输入图案作为卷积神经网络的输入,预测单一或全场感兴趣量(如应变能变化)。为应对小样本场景,研究团队提出了基于生成对抗网络(如StyleGAN2-ADA、WGAN)和程序化方法(如Procedural模式)的数据增强策略,将生成图案与真实图案混合后运行低 fidelity 模拟,再通过迁移学习微调至高 fidelity 数据。数据集还支持旋转增强(0°、90°、180°、270°),可在不增加模拟成本的情况下将训练数据扩展四倍。所有代码和数据集均已开源,便于复现和扩展。
背景与挑战
背景概述
Mechanical MNIST Cahn-Hilliard数据集由波士顿大学机械工程系的Hiba Kobeissi、Saeed Mohammadzadeh和Emma Lejeune于2022年创建,旨在解决生物软组织力学建模中材料异质性的关键挑战。该数据集基于Cahn-Hilliard方程生成微观结构图案,模拟了生物组织中常见的斑点和条纹形态,并通过有限元分析提供了104,813种异质材料在等双轴拉伸下的力学响应数据。作为Mechanical MNIST项目的延伸,它填补了固体力学领域开放基准数据集的空白,为利用深度学习构建异质材料力学元模型提供了标准化测试平台,显著推动了数据驱动方法在生物力学中的应用与发展。
当前挑战
该数据集面临的核心挑战包括:首先,生物软组织微观结构复杂且表征困难,传统有限元模拟计算成本高昂,难以在庞大输入参数空间内高效探索。其次,实际应用中可用的输入图案样本极为有限(如仅1,000例),导致深度学习元模型训练不足,过拟合风险高。在数据集构建过程中,从105,427个初始图案中筛选出104,813个可用仿真结果,需克服图案特征过小、轮廓复杂等处理难题。此外,生成对抗网络在有限数据下训练不稳定,需采用自适应判别器增强等技术平衡生成图案的真实性与多样性,以有效扩充训练数据集并提升元模型预测性能。
常用场景
经典使用场景
Mechanical MNIST Cahn-Hilliard 数据集在固体力学与机器学习交叉领域中扮演着基准测试的角色,尤其适用于评估基于深度学习的代理模型在预测非均质材料力学行为方面的性能。该数据集包含超过十万组由 Cahn-Hilliard 方程生成的空间异质性图案及其对应的等双轴拉伸有限元模拟结果,为研究者提供了一个标准化、可复现的平台,用以验证从输入材料分布到输出力学响应(如应变能变化)的端到端预测能力。其经典使用场景涵盖监督学习下的单标量量预测、迁移学习策略的效能评估,以及生成对抗网络在材料微结构数据增强中的应用。
实际应用
在实际应用中,该数据集为生物医学工程中的软组织力学仿真提供了经济高效的替代方案。通过训练基于该数据集的代理模型,研究者能够快速预测不同非均质材料分布下的力学响应,从而加速外科手术模拟、患者特异性手术规划以及体内生物力学机制的研究进程。此外,该数据集所验证的数据增强与迁移学习策略可直接应用于实验数据受限的场景,例如基于少量医学影像推断组织力学属性,进而支撑个性化医疗与植入物设计的工程实践。
衍生相关工作
该数据集衍生了一系列经典工作,包括基于 StyleGAN2-ADA 的生成式数据增强方法、WGAN-CP 与 WGAN-GP 在材料微结构生成中的对比研究,以及将过程化算法(如空间相关随机图案生成)与机器学习结合的低成本数据扩充策略。此外,研究者在此基础上发展了迁移学习框架,利用低保真度模拟数据预训练模型,再通过少量高保真数据微调,显著提升预测精度。这些工作不仅拓展了机械 MNIST 系列数据集的应用边界,也为非均质材料力学建模中的少样本学习与多保真度融合提供了可复用的技术路线。
以上内容由遇见数据集搜集并总结生成



