cross-scenario-physics-code-transfer
收藏数据集概述:Cross-Scenario Physics-Code Transfer Benchmark
基本信息
- 数据集名称:Cross-Scenario Physics-Code Transfer Benchmark(跨场景物理代码迁移基准)
- 许可证:Apache-2.0
- 语言:英语
- 数据规模:1K < n < 10K
- 数据集标签:物理、基准测试、跨场景迁移、组合性、冻结特征、视频基础模型、Kubric、Phys101
数据集核心内容
本数据集用于支持 NeurIPS 2026 评估与数据集轨道的投稿论文《A Benchmark for Cross-Scenario Physics-Code Transfer: Compositionality Metrics on Frozen Video Features》。当前版本为匿名评审版本,提供了审稿人检查数据质量和验证实验协议所需的核心子集。
文件结构
├── features/ │ └── vjepa2_collision_pooled.pt # V-JEPA 2 特征,600个碰撞场景,形状[600, 4, 1024],float32 ├── labels/ │ ├── labels_collision.npz # 600个碰撞场景的质量标量/分箱 + 恢复系数标量/分箱 │ ├── labels_ramp.npz # 斜坡场景的恢复系数 + 摩擦标签(300个场景) │ ├── labels_flat_drop.npz # 平面下落场景的恢复系数 + 摩擦标签(300个场景) │ ├── labels_elasticity.npz # 弹性场景的恢复系数 + 下落高度标签(600个场景) │ └── labels_ramp_3prop.npz # 斜坡场景的多属性训练标签(3属性) └── code/ # 重现论文结果的脚本(17个Python文件)
完整基准(论文描述) vs. 当前发布
当前发布内容(负载承载子集)
- V-JEPA 2 特征(碰撞源场景)
- 全部4个Kubric标签文件
- 完整重现代码
完整基准(论文中描述,约70GB)
- 全部4个Kubric场景:碰撞、斜坡、平面下落、弹性(总计1,800个场景)
- 75个场景的低重力碰撞变体(视觉匹配)
- 8个冻结骨干网络的预提取特征(V-JEPA 2、V-JEPA 2.1、DINOv2-S/L、CLIP ViT-L/14、MAE、SigLIP、VideoMAE)
- Phys101 V-JEPA 2 特征(弹簧/斜坡/下落,2,673个片段)
- 逐物体真实位置和速度轨迹
- 渲染的场景视频(256×256,48帧,24fps)
完整内容将在论文被接收后公开释放。
关键用途
可验证的结果
- 头版结果:前5 vs 后5的PosDis充分性观测,排列检验 p = 0.84
- 场景内协议验证
- 标签分箱逻辑验证
- 消息提取管道验证
- 24种配置扫描的排列检验
- 架构内分析
重现头版结果步骤
- 通过 Hugging Face CLI 下载数据集
- 建立预期目录结构
- 运行排列检验脚本:
python _compute_perm_test.py和python _compute_within_arch_perm.py - (可选)重新运行碰撞场景内发送器训练:
python _rev_q_addendum2_high_posdis.py
数据来源与场景
本数据集基于 Kubric 生成的物理模拟场景,包含以下物理属性:
- 质量(标量/分箱)
- 恢复系数(标量/分箱)
- 摩擦系数
- 下落高度
引用信息
bibtex @inproceedings{anonymous2026benchmark, title = {A Benchmark for Cross-Scenario Physics-Code Transfer: Compositionality Metrics on Frozen Video Features}, author = {Anonymous Authors}, booktitle = {NeurIPS 2026 Evaluations & Datasets Track (under review)}, year = {2026} }
许可说明
- 基准测试和代码:Apache License 2.0
- Phys101 特征:基于 Phys101(CC-BY 4.0)提取
- V-JEPA 2 / V-JEPA 2.1 特征:基于 Meta CC-BY-NC 4.0 研究许可证提取,仅用于非商业研究




