PhysInOne
收藏PhysInOne 数据集概述
数据集简介
PhysInOne 是一个旨在解决人工智能系统缺乏物理基础训练数据的关键性稀缺问题的大规模数据集。
规模与多样性
- 视频数量:包含 200 万个视频。
- 场景来源:由 153,810 个动态 3D 场景生成。
- 物理现象覆盖:涵盖 71 种日常环境中的基础物理现象,涉及四大主要领域:力学、光学、流体动力学、磁学。
- 物体数量:包含 2,231 个为日常物理交互定制的常见物体。
- 材料种类:丰富了 623 种材料,涵盖塑料、金属、木材、石材和织物五大类别。
- 背景环境:包含 528 个多样化的 3D 背景,以确保真实性和环境多样性。
场景特征
- 现象组合:每个场景涉及 1 至 3 种物理现象,以反映现实世界活动。
- 交互复杂性:支持复杂的多物体交互,场景复杂度递增。
- 物体数量:平均每个场景的物体数量为:单物理现象场景 3.9 个,双物理现象场景 6.3 个,三物理现象场景 7.8 个。
- 视角:每个场景从 13 个视角捕捉:12 个静态摄像头和 1 个移动摄像头。
标注信息
数据集提供丰富的标注,包括:
- 3D 几何信息
- 语义标签
- 物体运动与动力学信息
- 物理属性
- 自然语言场景描述
支持的应用
- 物理感知视频生成
- 短期与长期未来帧预测
- 物理属性估计
- 运动迁移
- 以及其他应用
相关资源链接
- 论文:https://arxiv.org/pdf/2604.09415
- 项目主页:https://vlar-group.github.io/PhysInOne.html
- 数据集地址:https://huggingface.co/datasets/vLAR-group/PhysInOne
引用
如果使用本数据集,请引用: bibtex @misc{zhou2026physinonevisualphysicslearning, title={PhysInOne: Visual Physics Learning and Reasoning in One Suite}, author={Siyuan Zhou and Hejun Wang and Hu Cheng and Jinxi Li and Dongsheng Wang and Junwei Jiang and Yixiao Jin and Jiayue Huang and Shiwei Mao and Shangjia Liu and Yafei Yang and Hongkang Song and Shenxing Wei and Zihui Zhang and Peng Huang and Shijie Liu and Zhengli Hao and Hao Li and Yitian Li and Wenqi Zhou and Zhihan Zhao and Zongqi He and Hongtao Wen and Shouwang Huang and Peng Yun and Bowen Cheng and Pok Kazaf Fu and Wai Kit Lai and Jiahao Chen and Kaiyuan Wang and Zhixuan Sun and Ziqi Li and Haochen Hu and Di Zhang and Chun Ho Yuen and Bing Wang and Zhihua Wang and Chuhang Zou and Bo Yang}, year={2026}, eprint={2604.09415}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2604.09415}, }
许可协议
本项目采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。协议链接:https://creativecommons.org/licenses/by-nc-sa/4.0/




