gwBenchmarks
收藏gwBenchmarks 数据集概述
gwBenchmarks 是一个用于评估基于大语言模型(LLM)的引力波(GW)建模的基准测试套件,所有任务均采用完全数值化、物理驱动的指标,避免人工评分,依赖引力波天文学中的标准损失函数。
基准测试任务
| 任务名称 | 输入 | 输出 | 损失函数 |
|---|---|---|---|
| 1. Waveform Bench(协同进动 h₂₂) | 质量比 q、自旋向量 chi1/chi2、时间网格 t_i | Re(h22(t_i)), Im(h22(t_i)) | 总质量 [40,80,120,160,200] M☉ 上的平均频域失配 |
| 2. Remnant Bench(反冲速度) | 质量比 q、自旋向量 chi1/chi2 | 反冲速度大小 v_k | NRMSE(v_k) |
| 3. Dynamics Bench(偏心自旋轨道动力学) | 质量比 q、自旋 chi1/chi2、初始条件 e0/x0、时间网格 t_i | 后牛顿频率参数 x(t_i) | x(t) 上的逐点 RMS 相对误差 |
| 4. Ringdown Bench(准正规模) | 最终自旋 chi_f、模式指数 (l,m,n) | omega_real, omega_imag | Re(ω) 和 Im(ω) 相对误差的平均值 |
| 5. Analytic Bench(非自旋双黑洞,q∈[1,20]) | 质量比 q、时间网格 t_i | Re(h22(t_i)), Im(h22(t_i)) | 总质量 [40,80,120,160,200] M☉ 上的平均频域失配 |
| 6. Validity Bench(NRHybSur3dq8 外推) | 质量比 q、自旋 chi1/chi2 | 预测失配 M̂ | RMSE(log M̂, log M*) |
| 7. Template Bank Bench(频域模板覆盖) | 公共波形参数池 [m1,m2,s1z,s2z] | 有序银行行 [m1,m2,s1z,s2z,phi_ref] | 达到 50% 隐藏测试覆盖(匹配度≥0.97)的最小银行前缀 |
| 8. New Physics Bench(RG-tail 旋近) | arXiv:2602.08833 中的物理公式 | h_of_f(f, Mc, eta, dL, lambda_RG, ...) 实现 | 144 个测试用例上的平均频域失配(4 Mc × 4 eta × 3 dL × 3 lambda_RG) |
频域失配计算
通过 PyCBC 计算,使用 aLIGO aLIGOZeroDetHighPower 功率谱密度(PSD),在时间和相位偏移上最大化:
mismatch = 1 - max_{t,phi} <h_pred, h_ref> / sqrt(<h_pred, h_pred> <h_ref, h_ref>)
频率范围:f_low = 15 Hz, f_high = 990 Hz。
数据集分布
二进制数据集文件因大小限制不存储在仓库中,托管于 Hugging Face:🤗 GWagents/gwBenchmarks
每个基准目录下包含 datasets/:
README.md— 数据集描述、参数范围、训练/验证划分scripts/— 数据处理和绘图脚本plots/— 数据集参考图
| 基准任务 | 训练集 | 验证集 |
|---|---|---|
| waveform | waveform_training.h5 |
waveform_validation.h5 |
| remnant | remnant_training.h5 |
remnant_validation.h5 |
| dynamics | dynamics_training.h5 |
dynamics_validation.h5 |
| ringdown | ringdown_training.h5 |
ringdown_validation.h5 |
| analytic | analytic_training.h5 |
analytic_validation.h5 |
| validity | validity_training.h5 |
validity_validation.h5 |
| template_bank | bank_wf_params.npy (+ grid/weights) |
bank_wf_params_test.npy |
| new_physics | 公式驱动,无训练集 | 参考在 gwbenchmarks/rg_tail_reference.py |
规则
- 评估时禁止暴力优化,所有输出必须是模型直接预测结果。
- 指标完全数值化且可重复。
项目结构
gwBenchmarks/ ├── gwbenchmarks/ │ ├── init.py │ ├── metrics.py # 频域失配、RMS相对误差、NRMSE │ ├── runner.py # 基准测试运行器 │ ├── rg_tail_reference.py # New Physics Bench参考波形 │ └── benchmarks/ │ ├── base.py # 抽象基准类 │ ├── waveform.py │ ├── remnant.py │ ├── dynamics.py │ ├── ringdown.py │ ├── analytic.py │ ├── validity.py │ ├── template_bank.py │ └── new_physics.py ├── configs/ # 每个基准的YAML配置 └── datasets/ # README、脚本、绘图(二进制数据在Hugging Face)




