five

Viscous_Cahn_Hilliard_2D_Spatio-Temporal

收藏
Hugging Face2025-12-27 更新2025-12-28 收录
下载链接:
https://huggingface.co/datasets/Tejas-Anvekar/Viscous_Cahn_Hilliard_2D_Spatio-Temporal
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含**2,000个高保真模拟**的**粘性Cahn-Hilliard(vCH)方程**在随机控制强迫下的模拟结果。它旨在支持**稀疏最优控制**、**科学机器学习(SciML)**和**相场建模**的研究。每个样本代表一个由外部控制场引导的两相系统(不相容组分的分离)的演化。数据是使用自定义的高精度有限差分求解器与Crank-Nicolson时间积分生成的。数据存储为一个5D张量(逻辑上),物理上分片为Parquet文件。形状为`(2000, 101, 128, 128, 4)`,维度为`(样本, 时间步, 高度, 宽度, 通道)`。通道定义包括相场序参数(φ)、化学势(μ)、辅助控制变量(w)和外部控制强迫场(u)。物理域为空间域Ω = [0, 1] × [0, 1],网格分辨率为128 × 128,时间范围为T = 1.0秒,时间分辨率为dt = 0.01。

This dataset contains **2,000 high-fidelity simulation results** of the **viscous Cahn-Hilliard (vCH) equation** under stochastic controlled forcing. It is designed to support research on **sparse optimal control**, **scientific machine learning (SciML)**, and **phase-field modeling**. Each sample represents the evolution of a two-phase system (separation of immiscible components) guided by an external control field. The data is generated using a custom high-precision finite difference solver coupled with the Crank-Nicolson time integration scheme. Logically structured as a 5D tensor, the data is physically partitioned into Parquet files, with a shape of `(2000, 101, 128, 128, 4)`. The dimensions correspond to `(sample, time step, height, width, channel)`. The four channels are defined as: phase-field order parameter (φ), chemical potential (μ), auxiliary control variable (w), and external controlled forcing field (u). The physical domain is the spatial domain Ω = [0, 1] × [0, 1], with a grid resolution of 128 × 128. The temporal span is T = 1.0 second, with a temporal resolution of dt = 0.01.
创建时间:
2025-12-27
原始信息汇总

数据集概述:Viscous Cahn-Hilliard Optimal Control

数据集简介

该数据集包含2000个高保真模拟,模拟对象为在随机控制力作用下的粘性Cahn-Hilliard方程。该数据集旨在支持稀疏最优控制科学机器学习相场建模领域的研究。 官方代码仓库:Sparse-optimal-control-of-Viscous-Chan-hilliard (GitHub) 每个样本代表一个由外部控制场引导的两相系统演化过程。数据使用自定义的高精度有限差分求解器结合Crank-Nicolson时间积分方法生成。

数据集结构

数据形状

数据在逻辑上存储为一个5维张量,物理上分片存储为Parquet文件。

  • 形状: (2000, 101, 128, 128, 4)
  • 维度: (样本数, 时间步长, 高度, 宽度, 通道数)

通道定义

根据data_process.py流程,4个通道分别对应:

  1. 通道 0 (phi / $varphi$): 相场序参数 ($varphi in [-1, 1]$)。代表两相之间的浓度差。
  2. 通道 1 (mu / $mu$): 化学势。定义为 $mu = -kappaDeltavarphi + f(varphi) - w$。
  3. 通道 2 (w): 辅助控制变量。由松弛方程 $gamma partial_t w + w = u$ 控制。
  4. 通道 3 (u): 施加于系统的外部控制力场。

物理域

  • 空间域: $Omega = [0, 1] imes [0, 1]$
  • 网格分辨率: $128 imes 128$ (均匀网格间距 $h approx 0.0078$)。
  • 时间范围: $T = 1.0$ 秒。
  • 时间分辨率: $dt = 0.01$ (每个模拟101帧)。

数据生成细节

物理模型

数据遵循具有对数势的粘性Cahn-Hilliard系统,确保相场严格保持在物理边界$(-1, 1)$内。

$$ egin{aligned} partial_t varphi - Delta mu &= 0
au partial_t varphi - kappa Delta varphi + f(varphi) &= mu + w
gamma partial_t w + w &= u end{aligned} $$

数值实现

求解器 (Forward2_solver.py) 采用:

  • 空间离散化: 使用诺伊曼边界条件的标准5点有限差分格式。
  • 时间积分: 半隐式Crank-Nicolson格式。
    • 隐式部分: 线性扩散和势的凸部分 ($c_1$)。
    • 显式部分: 势的凹部分 ($c_2$)。
  • 非线性求解器: 采用Armijo回溯线搜索的Monolithic Newton-Raphson方法。
  • 质量守恒: 通过全局拉格朗日乘子校正步骤强制执行。

模拟参数

数据集使用config.py中的配置生成:

参数 符号 描述
粘度 $ au$ 0.05 相方程的弛豫时间。
控制弛豫 $gamma$ 10.0 控制变量 $w$ 的阻尼因子。
界面宽度 $kappa$ 9.0e-4 梯度能量系数(控制界面厚度)。
势(凸) $c_1$ 0.75 Flory-Huggins对数系数。
势(凹) $c_2$ 1.0 二次失稳系数。
时间步长 $dt$ 0.01 采样率(求解器内部步长可能更小)。

输入控制生成

控制场 u 使用平滑随机场程序化生成:

  • 在傅里叶空间中生成随机噪声。
  • 应用低通滤波器 ($K^{-1.5}$) 以确保平滑性。
  • 使用三次样条在时间上插值关键帧,以创建连续变化的作用力。

如何加载 (Python)

python import pandas as pd import numpy as np from datasets import load_dataset

1. 加载数据集(推荐使用流式加载处理50GB数据)

dataset = load_dataset("your-username/your-repo-name", split="train", streaming=True)

2. 遍历样本

for row in dataset: # 3. 将展平的数组重塑回 (128, 128, 4) # 假设您的Parquet转换脚本将空间维度展平了 sample_id = row[sample_id] timestep = row[time_step]

# 形状取决于您特定的parquet转换脚本
# 针对展平的1维数组列的示例:
data_flat = np.array(row[readings]) 
frame_tensor = data_flat.reshape(128, 128, 4)

phi = frame_tensor[:, :, 0] # 相场
u   = frame_tensor[:, :, 3] # 控制输入

print(f"Sample {sample_id} at t={timestep}: Phi range [{phi.min():.2f}, {phi.max():.2f}]")
break
搜集汇总
数据集介绍
main_image_url
构建方式
在相场模型与最优控制交叉领域,该数据集通过高保真数值模拟构建而成。采用自定义有限差分求解器,结合Crank-Nicolson时间积分方案,对粘性Cahn-Hilliard方程进行离散化求解。空间上使用五点差分格式与Neumann边界条件,时间推进中隐式处理线性扩散项,显式处理势能凹部,并通过Newton-Raphson迭代确保非线性收敛。控制场通过傅里叶空间生成平滑随机场,经低通滤波与三次样条插值形成时空连续的外部激励,最终生成涵盖2000组样本、每样本101时间步的128×128网格四通道张量数据。
使用方法
该数据集适用于时空预测与图像到图像转换等机器学习任务,可通过HuggingFace数据集库直接加载。建议采用流式读取模式处理约50GB的数据规模,按样本标识与时间步索引逐帧解析。数据重构需将扁平化数组恢复为128×128×4的三维张量,分别提取相场、化学势、控制变量与外部激励通道。典型应用场景包括稀疏最优控制算法验证、科学机器学习模型训练,以及相场动力学可视化分析,为跨学科研究提供标准化基准。
背景与挑战
背景概述
在相场模型与科学机器学习交叉领域,Viscous Cahn-Hilliard方程作为描述两相系统演化的重要数学模型,其数值模拟与最优控制研究对于材料科学、流体力学及软物质物理具有深远意义。该数据集由相关研究团队于近年创建,旨在为稀疏最优控制、科学机器学习算法验证提供高质量基准数据。通过高精度有限差分求解器结合Crank-Nicolson时间积分方法,生成了两千组受随机控制场驱动的二维时空演化序列,有效支撑了相场动力学控制策略的定量分析与模型训练。
当前挑战
该数据集致力于解决相场系统时空演化的最优控制问题,其核心挑战在于高维非线性偏微分方程控制的复杂性,包括系统状态的多尺度特征捕捉、控制输入的稀疏性约束满足以及物理约束下稳定性保证。构建过程中面临数值求解的高计算成本挑战,需平衡计算精度与效率;同时,平滑随机控制场的生成需确保物理合理性,避免引入非物理振荡,且大规模数据存储与高效访问要求精心的数据结构设计。
常用场景
经典使用场景
在相场建模与科学机器学习领域,Viscous_Cahn_Hilliard_2D_Spatio-Temporal数据集为研究粘性Cahn-Hilliard方程的控制动力学提供了高保真模拟基准。该数据集通过包含相场参数、化学势、辅助控制变量及外部控制力场的四通道时空演化数据,经典地应用于开发与验证稀疏最优控制算法。研究者利用其128×128网格分辨率与101时间步的序列,能够深入探索在随机控制力驱动下两相分离系统的动态行为,为偏微分方程控制理论提供了丰富的数值实验平台。
解决学术问题
该数据集有效应对了相场模型中控制策略设计与验证的若干核心学术挑战。通过提供大规模、高精度的受控粘性Cahn-Hilliard系统模拟数据,它使得研究者能够系统性地研究外部干预如何影响相分离过程的动力学与形态演化。这为探索非线性偏微分方程的最优控制、界面运动建模以及科学机器学习中数据驱动方法的泛化能力等关键问题,提供了不可或缺的实证基础,显著推进了计算物理与控制系统交叉领域的前沿进展。
实际应用
在工程与材料科学实践中,该数据集所模拟的受控相分离过程具有直接的应用价值。例如,在先进材料制造中,通过外部场精确调控微观结构形貌以优化材料性能,如合金的析出强化或高分子共混物的相形态设计。数据集中的控制力场模拟为开发实时控制策略提供了训练与测试场景,助力实现智能材料加工、微流体器件中的图案化操控,乃至生物组织中细胞分化的物理建模,体现了从理论模拟到工业应用的桥梁作用。
数据集最近研究
最新研究方向
在相场模型与科学机器学习交叉领域,Viscous Cahn-Hilliard方程数据集正推动稀疏最优控制研究的前沿探索。该数据集通过高保真模拟捕捉了两相系统在外加控制场作用下的时空演化,为开发基于物理信息的神经网络架构提供了关键基准。当前热点聚焦于利用深度强化学习与可微分编程技术,实现对复杂相分离动力学的高效实时调控,旨在解决材料科学中微观结构设计的优化难题。这些进展不仅深化了非线性偏微分方程控制理论的理解,也为智能制造和软物质工程中的精准操控开辟了新途径。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作