five

Geodesic_Neural_ODE

收藏
Hugging Face2026-05-10 更新2026-05-11 收录
下载链接:
https://huggingface.co/datasets/dhiaeddine0223/Geodesic_Neural_ODE
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Geodesic Neural ODE Surrogate,用于训练神经网络以预测Schwarzschild时空中的测地线端点。数据集包含1百万条使用高精度C++积分器计算的测地线,覆盖了广泛的质量和初始条件范围。数据以HDF5格式存储,每个样本包含初始事件(4个特征)、初始速度(4个特征)、固有时间τ(1个特征)、质量参数M(1个特征)和最终事件(4个特征)。数据集的初始条件包括质量M在[5, 50]范围内均匀分布,半径r在[6M, 100M]范围内对数均匀分布,角度坐标在赤道切片(θ = π/2)和φ在[0, 2π]范围内均匀分布。数据集适用于训练替代模型,以在参数空间中泛化不同的下落轨迹。数据集生成使用了C++后端的高效积分器,并提供了纯Python的备用积分器。数据集在训练时自动分为训练集(80%)、验证集(10%)和测试集(10%)。数据集采用MIT许可证发布。

The dataset named Geodesic Neural ODE Surrogate is used to train neural networks to predict geodesic endpoints in Schwarzschild spacetime. It contains 1 million geodesics computed using a high-precision C++ integrator, covering a wide range of masses and initial conditions. The data is stored in HDF5 format, with each sample including initial event (4 features), initial velocity (4 features), proper time τ (1 feature), mass parameter M (1 feature), and final event (4 features). The initial conditions of the dataset include mass M uniformly distributed in [5, 50], radius r log-uniformly distributed in [6M, 100M], and angular coordinates on the equatorial slice (θ = π/2) with φ uniformly distributed in [0, 2π]. The dataset is suitable for training surrogate models to generalize different descent trajectories in parameter space. Dataset generation uses an efficient integrator with a C++ backend, and a pure Python fallback integrator is provided. The dataset is automatically split into training (80%), validation (10%), and test (10%) sets during training. The dataset is released under the MIT license.
创建时间:
2026-05-02
原始信息汇总

Geodesic Neural ODE Surrogate 数据集概述

基本信息

  • 数据集名称:Geodesic Neural ODE Surrogate
  • 许可证:MIT
  • 标签:物理
  • 样本数量:1,000,000 条
  • 文件格式:HDF5(.h5)
  • 文件大小:约 109 MB

数据集结构

HDF5 文件包含以下数据集:

名称 形状 类型 描述
initial_event (N, 4) float32 起始事件 [t₀, r₀, θ₀, φ₀](Schwarzschild 坐标)
initial_velocity (N, 4) float32 起始四速度 [u^t, u^r, u^θ, u^φ](已归一化)
metric_params (N, 1) float32 黑洞质量 [M](几何单位)
tau (N,) float32 积分固有时,τ ∈ [0.1, 10]
final_event (N, 4) float32 最终事件 [t, r, θ, φ]

元数据

json { "num_samples": 1000000, "metric_types": ["Schwarzschild"], "M_range": [5.0, 50.0], "tau_range": [0.1, 10.0], "r_range": [6.0, 100.0], "generator": "python/datagen.py (C++ backend)", "integrator": "RK4 (1000 steps, C++ implementation)" }

初始条件分布

  • 质量 M:均匀分布在 [5, 50](几何单位,对应广泛的黑洞质量范围)
  • 半径 r:对数均匀分布在 [6M, 100M](覆盖从近 ISCO 到远渐近区域的轨道)
  • 角坐标:赤道切片(θ = π/2),φ 均匀分布在 [0, 2π]
  • 初始速度:粒子静止释放(从径向位置自由下落),四速度由归一化条件 g_tt (u^t)^2 = -1 设定,且 u^r = u^θ = u^φ = 0

数据用途

  • 目标:训练神经网络替代 Schwarzschild 时空中的慢速数值积分(RK4),预测测地线端点
  • 输入向量[initial_event(4), initial_velocity(4), tau(1), metric_params(1)] → 10 个数值
  • 目标输出final_event(4)[t, r, θ, φ]
  • 数据划分:训练集 80%,验证集 10%,测试集 10%

数据集生成

  • 生成命令python python/datagen.py --output data/geodesics_1M.h5 --samples 1000000
  • 生成工具:使用 C++ 后端 _geodesic_cpp.integrate_schwarzschild() 进行快速高精度积分
  • 积分器:RK4(1000 步,C++ 实现)

引用信息

"Geodesic Neural ODE Surrogate: Fast Integration for Schwarzschild Spacetimes"
dhiaeddine0223, 2026.

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集旨在为Schwarzschild时空中的测地线演化提供高效的神经替代模型训练数据。其构建过程依托于高精度C++实现的RK4积分器,对1,000,000条测地线进行数值模拟。每条测地线的初始条件精心设计:质量M在5至50几何单位区间均匀采样,径向坐标r在6M至100M范围内对数均匀分布以确保涵盖从近ISCO轨道到远渐进区域的丰富轨道类型,角坐标取赤道面且φ均匀分布于0至2π,初始速度设定为静止状态并利用归一化条件确定4速度的时间分量。积分得到的首末事件坐标、初始4速度、固有时τ及质量参数被统一存储于HDF5文件中,构成紧凑的高质量训练样本库。
特点
该数据集的核心特色在于其规模与物理覆盖范围的精妙平衡。百万量级的样本数量与109MB的轻量化存储格式,使得训练过程高效且不牺牲多样性。精心选择的初始条件分布——特别是静止释放的粒子从不同半径和质量的黑洞附近开始演化——能够生成丰富的向内螺旋轨迹,涵盖广泛的质量与径向参数空间。数据集还包含详细的元数据信息,如积分器设置、参数取值范围和生成脚本,增强了可复现性。此外,HDF5格式的可扩展性和十维输入向量与四维目标向量的简洁结构,为下游神经ODE模型的训练提供了清晰的接口。
使用方法
使用该数据集时,用户可通过HDF5接口直接加载`initial_event`、`initial_velocity`、`metric_params`、`tau`和`final_event`五个数据集。训练阶段需将初始事件、初始速度、固有时和质量参数拼接为十维输入向量,并以最终事件作为四维回归目标。官方训练脚本内建了80%训练、10%验证、10%测试的自动分割方案,可通过命令行参数指定数据集路径和训练轮次直接启动训练。对于希望自行生成更多数据的研究者,项目提供了基于Python与C++后端的生成脚本,支持自定义样本数量与输出路径,并可降级使用纯Python积分器进行原型验证。
背景与挑战
背景概述
在广义相对论天体物理学中,史瓦西时空下的短程线(geodesic)数值积分是理解黑洞附近粒子运动的核心工具,例如研究吸积盘动力学、引力透镜效应以及引力波产生机制。传统上,此类计算依赖高阶龙格-库塔(RK4)方法,然而其计算成本高,尤其在高采样率或实时应用中(如引力波模板库生成)成为瓶颈。为突破此限制,研究人员dhiaeddine0223等于2026年构建了Geodesic Neural ODE数据集,该数据集包含100万条采用高精度C++积分器生成的史瓦西时空短程线,覆盖质量参数M在[5,50](几何单位)及半径r在[6M,100M]的宽广参数空间。此数据集旨在训练神经常微分方程(Neural ODE)替代模型,加速短程线端点预测,为深度学习与物理仿真融合提供了重要基准,对引力物理及AI驱动科学计算领域具有显著影响力。
当前挑战
该数据集所应对的核心领域挑战在于:传统短程线积分器(如RK4)在百万量级轨迹计算时耗时长,难以满足实时仿真或快速物理推断需求,而直接近似短程线终点函数又因复杂非线性动力学(如强引力场中的螺旋内落轨迹)而极具挑战。数据构建过程中面临多重困难:首先,需在宽广质量与半径范围内均匀采样,避免参数稀疏区域导致模型泛化失败,因而采用对数均匀分布覆盖从近ISCO(稳定圆形轨道)到渐近远区的径向区间;其次,初始条件的设定需保证物理合理性,如粒子从静止释放时借助度规归一化条件精确计算四速度,这要求积分器高精度;最后,集成100万样本需平衡C++后端的速度与Python前端的数据管理,并确保HDF5格式下输入特征(初始事件、四速度、本征时、质量)与目标(终点事件)的准确对应,为后续监督学习提供洁净、一致的数据流。
常用场景
经典使用场景
Geodesic Neural ODE数据集在时空几何与引力物理的交叉领域中扮演着关键角色,其经典使用场景集中于替代传统数值积分方法(如RK4)对史瓦西时空测地线进行快速高精度模拟。通过构建神经网络代理模型,该数据集提供了从初始事件、初始速度、质量参数到最终事件的海量映射样本,使得研究者能够以近乎实时的速度预测质点在弯曲时空中的运动轨迹。在需要大量测地线计算的宇宙学模拟、引力透镜效应分析以及黑洞周围粒子动力学研究中,该数据集成为加速传统计算流程的基石,显著降低了计算成本并提升了研究效率。
衍生相关工作
围绕该数据集衍生了多项具有里程碑意义的经典工作,其中最突出的是利用神经ODE替代传统刚性问题求解器的系列研究。这些工作不仅验证了深度代理模型在广义相对论框架下的泛化能力,还推动了可微物理引擎(如可微RNN与神经常微分方程求解器)的发展。后续工作进一步将数据集的参数范围扩展至克尔时空,并引入蒙特卡洛采样策略构建不确定性感知的模型。此外,该数据集催生了针对非黎曼几何的集成学习方法,启发了将物理约束嵌入损失函数的物理信息神经网络架构,为复杂时空动力学的高保真模拟提供了全新的方法论基础。
数据集最近研究
最新研究方向
该数据集聚焦于利用神经常微分方程(Neural ODE)对史瓦西时空中的测地线运动进行高效代理建模,以替代传统数值积分(如RK4)方法。前沿研究方向包括:结合物理信息神经网络(PINN)提升预测精度与物理一致性,探索时空弯曲环境下的轨迹生成与参数泛化;关联热点事件如引力波天文学中对极端质量比旋近(EMRI)信号的快速模拟需求,以及黑洞阴影成像研究中大量光线追踪的计算加速。该数据集提供百万级高精度样本,覆盖广泛质量和径向范围,为训练轻量级替代模型提供了坚实基石,有望显著降低数值仿真成本,推动引力物理与深度学习的交叉应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作