five

基于动力学蒙特卡洛模拟的数据集

收藏
arXiv2025-07-29 更新2025-08-08 收录
下载链接:
https://archive.materialscloud.org/records/yssqm-36792
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集基于动力学蒙特卡洛模拟生成,用于研究二维多粒子系统的表面步骤波动及其相关的时间依赖性粗糙度。数据集包含了300条独立的KMC运行轨迹,每条轨迹包含1000个时间步长的状态快照,这些快照记录了原子边缘扩散过程中系统的演化。该数据集的创建旨在通过生成对抗网络(GANs)学习随机动力学,从而替代传统的模型并捕捉热波动。数据集的内容来源于简单的立方材料{100}表面的二维晶格KMC模拟,初始状态为一个条形区域,随着时间的推移,由于热波动,该区域逐渐变得粗糙。该数据集可用于加速模拟过程,并提高预测能力,同时考虑到对称性和守恒定律,无需详细了解潜在的势能景观即可训练模型。

This dataset is generated via kinetic Monte Carlo (KMC) simulations to investigate surface step fluctuations and their associated time-dependent roughness in two-dimensional multi-particle systems. It contains 300 independent KMC run trajectories, each with 1000 time-step state snapshots that record the system's evolution during atomic step edge diffusion processes. This dataset was developed to learn stochastic dynamics using Generative Adversarial Networks (GANs), replacing traditional models while capturing thermal fluctuations. The dataset originates from two-dimensional lattice KMC simulations on the {100} surface of a simple cubic material, starting with an initial stripe-shaped region that gradually becomes rough over time due to thermal fluctuations. It can be used to accelerate simulation workflows and enhance prediction capabilities, enabling model training without detailed knowledge of the underlying potential energy landscape while accounting for symmetry and conservation laws.
提供机构:
意大利米兰-比可卡大学材料科学系
创建时间:
2025-07-29
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于动力学蒙特卡洛(KMC)模拟构建,专注于研究晶体表面原子台阶的随机动力学行为。通过二维晶格KMC模拟,生成了包含300次独立运行的轨迹数据,每次运行保存1000个时间间隔为τ的连续快照。模拟参数设置为J=0.1 eV和T=290 K,采用周期性边界条件,初始配置为均匀厚度的条纹结构。数据集的构建充分考虑了时间间隔τ的选择,以确保系统在τ时间内经历显著的动力学演化,同时避免了过长的间隔导致动力学信息丢失。
特点
该数据集的特点在于其高度逼真的随机动力学模拟,能够精确捕捉晶体表面台阶的热涨落行为。数据集不仅包含原子级别的细节,还通过高斯卷积和加性噪声处理,实现了从尖锐界面到扩散界面表示的转换,便于与连续介质模型(如相场方法)对接。此外,数据集提供了丰富的统计特性,包括平衡态和动力学性质的定量描述,如台阶粗糙度的标度行为和时间演化规律,为机器学习模型提供了高质量的监督信号。
使用方法
该数据集主要用于训练生成对抗网络(GAN)以学习随机动力学规律。通过条件GAN框架,将系统当前状态φ_t与潜在空间样本z作为输入,生成下一时间步的状态φ_{t+τ}。训练后的GAN可作为自回归模型生成新的随机轨迹,显著加速模拟过程。数据集还可用于验证生成模型的准确性,如通过比较生成轨迹与KMC模拟的平衡态粗糙度、涨落幅度和动力学标度律。此外,卷积处理后的数据支持跨尺度研究,为连接原子尺度与连续介质尺度模拟提供了桥梁。
背景与挑战
背景概述
基于动力学蒙特卡洛模拟的数据集由Daniele Lanzoni等研究人员于2025年创建,旨在通过生成对抗网络(GANs)学习随机动力学,以替代传统模型并捕捉热涨落。该数据集专注于二维多粒子系统的表面台阶波动及其相关的时间依赖性粗糙度。通过动力学蒙特卡洛(KMC)模拟构建数据集后,研究人员训练了一个条件GAN,以随机传播系统状态,从而以较低的计算成本生成新序列。该研究展示了GAN在定量重现平衡和动力学特性方面的能力,包括标度定律,与精确值的偏差仅为几个百分点。这一工作为凝聚态物理、材料科学和工程领域的非平衡过程模拟提供了新的工具。
当前挑战
该数据集面临的挑战主要包括两个方面:领域问题的挑战和构建过程中的挑战。在领域问题方面,数据集旨在解决随机动力学模拟中的计算成本高和热涨落捕捉困难的问题,特别是在多粒子系统中。传统方法如分子动力学(MD)和动力学蒙特卡洛(KMC)在模拟真实时空尺度时存在局限性。在构建过程中,研究人员需要克服GAN训练的不稳定性问题,特别是在处理离散的KMC配置时。此外,为了确保生成的动力学轨迹的物理准确性,还需要将质量守恒定律等物理约束整合到GAN架构中。这些挑战使得数据集的构建和模型的训练变得复杂且具有较高的技术难度。
常用场景
经典使用场景
基于动力学蒙特卡洛模拟的数据集在表面科学和材料科学领域具有广泛的应用。该数据集通过模拟晶体表面原子台阶的随机波动,为研究表面粗糙化、原子扩散和晶体生长等过程提供了宝贵的数据支持。特别是在研究表面催化反应和晶体生长动力学时,该数据集能够提供高精度的原子尺度动态信息。
解决学术问题
该数据集解决了传统动力学蒙特卡洛模拟在时间和空间尺度上的限制问题。通过生成对抗网络(GANs)学习随机动力学,数据集能够在保持预测精度的同时显著降低计算成本。此外,该方法还成功捕捉了热涨落效应,为研究非平衡过程(如成核、生长和相变)提供了新的工具。
衍生相关工作
该数据集衍生了一系列经典工作,包括基于生成对抗网络的随机动力学模拟方法、结合物理先验的神经网络架构设计,以及从原子尺度到连续介质模型的跨尺度模拟框架。这些工作不仅推动了计算材料科学的发展,还为其他领域(如蛋白质折叠和天体物理)的随机过程模拟提供了新思路。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作