five

Synthetic Datasets for Machine Learning on Spatio-Temporal Graphs using PDEs

收藏
arXiv2025-02-06 更新2025-02-25 收录
下载链接:
https://github.com/github-usr-ano/Temporal_Graph_Data_PDEs
下载链接
链接失效反馈
官方服务:
资源简介:
本研究创建了基于偏微分方程(PDEs)的合成数据集,用于支持机器学习在时空图上的建模。数据集包括三种不同灾难和风险的模型,如流行病学、大气颗粒物和海啸波。这些数据集基于PDEs生成,并可用于时空图机器学习的基准测试和模型训练。
提供机构:
Fraunhofer Heinrich Hertz Institut, Berlin
创建时间:
2025-02-06
搜集汇总
数据集介绍
main_image_url
构建方式
本研究通过数值方法求解偏微分方程(PDEs)创建了一个合成数据集,旨在解决现有数据集在质量、范围、应用、可访问性和适应性方面的局限性。研究人员使用了有限元方法(FEM)在非规则域上求解三个不同的PDEs,并评估其在非规则分布的点上的解,以模拟现实世界中的应用场景。随后,他们从获得的值和底层空间结构中形成时间依赖图,为研究人员提供直接访问权限。
特点
该数据集的特点包括:1)基于PDEs的合成数据集,为时空图机器学习社区提供了第一个此类数据集;2)提供了详细的代码和方法的发布,鼓励其他实践者适应该方法;3)使用FEM方法,允许复杂域和边界条件,并促进了代码的适应性;4)提供了迄今为止最大规模的公共流行病时空图数据集;5)首次在合成数据上进行流行病时空图模型的预训练,并将其转移到现实世界数据上,显著提高了模型性能。
使用方法
使用该数据集的方法包括:1)基准测试:在流行病数据集上对几种机器学习模型进行基准测试,以展示数据集的效用;2)迁移学习:在合成数据上预训练模型,然后将其转移到现实世界数据上,以展示预训练数据对实际数据性能的提升;3)数据集生成:利用FEM方法,研究人员可以根据个人需求创建自定义的数据集和基准。
背景与挑战
背景概述
在机器学习领域,时空图模型对于理解复杂几何结构具有重要意义,如表面、体积或传感器网络。然而,目前缺乏高质量的时空数据集,这限制了机器学习模型的发展。为了克服这一限制,Fraunhofer Heinrich Hertz Institut 的研究人员提出了一种基于偏微分方程(PDE)的合成数据集,旨在为时空图机器学习提供数据支持。该数据集创建了三个基于 PDE 的时空数据集,分别模拟流行病学、大气颗粒物和海啸波等不同类型的灾害和危害。此外,该数据集还展示了如何在流行病学数据集上对几种机器学习模型进行基准测试,并证明了在合成数据集上进行预训练可以显著提高模型在真实世界数据上的性能。
当前挑战
该数据集的主要挑战包括:1)所解决的领域问题:时空图机器学习在流行病学、大气颗粒物和海啸波等领域的应用;2)构建过程中所遇到的挑战:创建高质量的合成数据集需要解决PDE求解、时空图构建等问题。
常用场景
经典使用场景
该数据集最经典的使用场景在于为时空图机器学习社区提供基于偏微分方程(PDE)的建模支持,以解决数据稀缺问题。通过创建和使用基于PDE的合成数据集,研究人员可以对不同类型的应用进行时空图建模。例如,该数据集可用于模拟传染病学、大气颗粒物和海啸波等领域的灾难和危害。
衍生相关工作
该数据集的发布推动了时空图机器学习领域的研究进展,衍生了多个相关研究工作。例如,基于该数据集的预训练模型在真实世界数据上的性能得到了显著提升,这为时空图机器学习模型的预训练和迁移学习提供了新的思路和方法。此外,该数据集还激发了研究人员对时空图机器学习模型在不同领域的应用探索,如金融数学、气候建模、生物力学和地震学等。
数据集最近研究
最新研究方向
在机器学习领域中,时空图模型因其强大的表达能力而备受关注。然而,构建高质量的时空图数据集一直是一项挑战。本文介绍了一个名为“Synthetic Datasets for Machine Learning on Spatio-Temporal Graphs using PDEs”的数据集,该数据集基于偏微分方程(PDEs)生成,旨在解决数据稀缺问题,并为时空图机器学习社区提供先进的PDE建模技术。该数据集涵盖了传染病学、大气颗粒物和海啸波等领域的不同类型灾害和危害的模型,并通过基准测试展示了其在机器学习模型上的应用。此外,研究还表明,在合成数据集上进行预训练可以显著提高模型在真实世界数据上的性能。该数据集的创建方法和代码已公开发布,为研究人员提供了创建定制化数据集和基准测试的机会,有助于推动时空图机器学习的发展。
相关研究论文
  • 1
    Synthetic Datasets for Machine Learning on Spatio-Temporal Graphs using PDEs Fraunhofer Heinrich Hertz Institut, Berlin · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作