PhysInOne
收藏PhysInOne 数据集概述
数据集简介
PhysInOne 是一个旨在解决AI系统缺乏物理基础训练数据的关键性稀缺问题的大规模数据集。
规模与多样性
- 视频与场景规模:包含从 153,810 个动态3D场景 生成的 200 万个视频。
- 物理现象覆盖:涵盖日常环境中的 71 种基本物理现象,横跨四大领域:力学、光学、流体动力学、磁学。
- 物体与材料:
- 包含 2,231 个 针对日常物理交互定制的常见物体。
- 使用 623 种材料 进行丰富,涵盖五类:塑料、金属、木材、石材、织物。
- 环境背景:包含 528 个多样化的3D背景,以确保真实感和环境多样性。
场景特征
- 物理现象组合:每个场景涉及 1-3 种物理现象,反映现实世界活动,包括单物理、双物理和三物理活动。
- 复杂物体交互:支持复杂的多物体交互,场景复杂度递增:
- 单物理场景平均物体数:3.9 个。
- 双物理场景平均物体数:6.3 个。
- 三物理场景平均物体数:7.8 个。
- 视角捕捉:每个场景从 13 个视角 捕捉,包括 12 个静态摄像头 和 1 个移动摄像头。
丰富标注
- 3D几何信息
- 语义标签
- 物体运动与动力学数据
- 物理属性
- 自然语言场景描述
支持的应用
- 物理感知视频生成
- 短期与长期未来帧预测
- 物理属性估计
- 运动迁移
数据集示例(部分)
- 力学:包含双物理活动示例,展示了弹射、重力、碰撞与结构力传递。
- 流体动力学:包含三物理活动示例,展示了重力驱动下的多层水流与动态平衡。
- 磁学:包含三物理活动示例,展示了磁铁排斥与气球浮力。
- 光学:包含三物理活动示例,展示了激光路径与物体遮挡。
基准测试结果摘要
数据集在四个物理相关任务上进行了定量评估。
物理感知视频生成
评估了使用与未使用PhysInOne微调的视频生成模型。部分最佳结果:
- SVDsft 模型在PMF(3.147)和FVD(143)指标上表现最佳。
- CogVideoX 模型在PMF(2.877)和人类评分(2.98)上表现最佳。
- Wan2.2-5Bsft 模型在PMF(2.978)和人类评分(5.95)上表现最佳。
未来帧预测
长期预测(已知/新视角)
模型从视频前半部分预测约78帧未来帧(约提前2.6秒)。部分最佳结果:
- MAGI-1 模型在已知视角的PMF(4.086)和PSNR(23.14)指标上表现最佳。
- DefGS 模型在已知视角的SSIM(0.833)和LPIPS(0.192)指标上表现最佳。
- FreeGave 模型在新视角的SSIM(0.619)指标上表现最佳。
- DefGS 模型在新视角的LPIPS(0.348)指标上表现最佳。
短期预测(已知/新视角)
模型从流式输入中实时连续预测接下来10帧。部分最佳结果:
- FreeGave 模型在已知视角的PMF(4.742)和PSNR(27.09)指标上表现最佳。
- MAGI-1 模型在已知视角的SSIM(0.886)和LPIPS(0.116)指标上表现最佳。
- DefGS 模型在新视角的PSNR(20.92)、SSIM(0.739)和LPIPS(0.322)指标上表现最佳。
物理属性估计
使用估计属性重新模拟
比较使用估计物理属性重新模拟的视频。GIC 模型在PMF(5.938)、PSNR(26.90)、SSIM(0.950)和LPIPS(0.074)所有指标上均优于PAC-NeRF模型。
按材料类型的属性估计误差
展示了不同材料物理参数估计的百分比误差(%),数值越低越好。
- 弹性固体:GIC在log₁₀(E)(49.76)和v(3.32)上误差更低;PAC-NeRF在ν(14.26)上误差更低。
- 塑性材料:PAC-NeRF在log₁₀(E)(68.38)、ν(15.79)和v(3.25)上误差更低;GIC在log₁₀(τY)(17.11)上误差更低。
- 牛顿流体:GIC在log₁₀(μ)(8.78)和log₁₀(κ)(70.07)上误差更低;PAC-NeRF在v(3.11)上误差更低。
- 颗粒物质:PAC-NeRF在θfric(16.87)和v(3.29)上误差更低。
- 非牛顿流体:GIC在log₁₀(μ)(124.26)、log₁₀(κ)(181.87)、log₁₀(τY)(28.78)和log₁₀(η)(24.97)上误差更低;PAC-NeRF在v(2.95)上误差更低。
运动迁移
评估将物理运动动态从源视频迁移到目标图像。MotionPro 模型在PMF(3.484)、PSNR(20.28)和SSIM(0.775)指标上优于GoWithTheFlow模型;GoWithTheFlow在LPIPS(0.410)上表现更佳。
作者与引用
-
主要作者:Siyuan Zhou, Hejun Wang, Hu Cheng, Jinxi Li, Dongsheng Wang 等(详见页面列表)。
-
通讯作者:Bo Yang (
bo.yang@polyu.edu.hk)。 -
BibTeX引用:
@misc{zhou2026physinonevisualphysicslearning, title={PhysInOne: Visual Physics Learning and Reasoning in One Suite}, author={Siyuan Zhou and Hejun Wang and Hu Cheng and Jinxi Li and Dongsheng Wang and Junwei Jiang and Yixiao Jin and Jiayue Huang and Shiwei Mao and Shangjia Liu and Yafei Yang and Hongkang Song and Shenxing Wei and Zihui Zhang and Peng Huang and Shijie Liu and Zhengli Hao and Hao Li and Yitian Li and Wenqi Zhou and Zhihan Zhao and Zongqi He and Hongtao Wen and Shouwang Huang and Peng Yun and Bowen Cheng and Pok Kazaf Fu and Wai Kit Lai and Jiahao Chen and Kaiyuan Wang and Zhixuan Sun and Ziqi Li and Haochen Hu and Di Zhang and Chun Ho Yuen and Bing Wang and Zhihua Wang and Chuhang Zou and Bo Yang}, year={2026}, eprint={2604.09415}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2604.09415}, }




