five

SuperCLEVR-Physics

收藏
github2024-06-23 更新2024-06-24 收录
下载链接:
https://github.com/XingruiWang/SuperCLEVR-Physics
下载链接
链接失效反馈
官方服务:
资源简介:
一个专注于物体动力学特性(如速度、加速度)及其在4D场景中碰撞的视频问答数据集。数据集包含物体的静态属性(形状、颜色)、3D动力学属性(3D位置、速度、外力)以及物理属性(质量、摩擦、恢复系数),并记录碰撞事件。

A video question answering dataset focused on the dynamic properties of objects (e.g., velocity, acceleration) and their collisions in 4D scenes. The dataset includes the static attributes of objects (shape, color), 3D dynamic properties (3D position, velocity, external force), as well as physical properties (mass, friction, coefficient of restitution), and records collision events.
创建时间:
2024-06-02
原始信息汇总

SuperCLEVR Physics 数据集概述

数据集描述

SuperCLEVR Physics 是一个用于视频问答的动态3D场景理解数据集。该数据集包含以下类型的标注信息:

  1. 静态属性:形状(shape)、颜色(color)。
  2. 动态3D属性:3D位置(3D position)、速度(velocities)、外力(external forces)。
  3. 物理属性:质量(mass)、摩擦(frictions)、恢复系数(restitution);以及碰撞事件(objects involved, frame)。

相关工作

  • SuperCLEVR:一个用于领域鲁棒性的视觉问答(VQA)数据集,涉及四个因素:视觉复杂性、问题冗余性、概念分布、概念组合性。
  • SuperCLEVR-3D:一个用于3D感知场景理解的VQA数据集,包括3D姿态、部件和遮挡。

视频问答

数据集设计了关于物体动态属性和碰撞事件的问题,包括以下类型:

  • 事实性问题(factual question)
  • 预测性问题(predictive question)
  • 反事实问题(counterfactual question)

数据生成

环境设置

  • Python版本:3.10

  • 依赖安装:基于Kubric项目,使用以下命令安装依赖: bash pip install -r requirements.txt

  • bpy安装:用于Blender软件的Python包,使用以下命令安装: bash pip install bpy==3.5

视频渲染

通过运行以下脚本生成新场景和视频渲染: bash bash run.sh

示例生成100个视频: bash time="$(date +%Y-%m-%d_%H-%M-%S)" for num in {0..100} do CUDA_VISIBLE_DEVICES=xx python sim_render_color_defined_load_scene.py --data_dir=assets --job-dir=output/superclevr-physics --scratch_dir=output/tmp/tmp-$time --camera=fixed --height=realistic --iteration=$num --scene_size 5 done

输出文件夹结构示例:

output/superclevr-physics └───super_clevr_0 │ └───events.json | └───metadata.json | └───rgba_00000.png | └───rgba_00001.png | └───... | └───rgba_00120.png └───super_clevr_1 │ └───events.json | └───metadata.json | └───rgba_00000.png | └───rgba_00001.png | └───... | └───rgba_00120.png

引用

@article{wang2024compositional, title={Compositional 4D Dynamic Scenes Understanding with Physics Priors for Video Question Answering}, author={Wang, Xingrui and Ma, Wufei and Wang, Angtian and Chen, Shuo and Kortylewski, Adam and Yuille, Alan}, journal={arXiv preprint arXiv:2406.00622}, year={2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
SuperCLEVR-Physics数据集的构建基于Kubric框架,通过Blender软件进行3D场景的动态渲染。该数据集不仅捕捉了物体的静态属性如形状和颜色,还详细记录了物体的动态属性,包括3D位置、速度、外力作用以及物理属性如质量、摩擦力和恢复系数。此外,数据集还特别关注碰撞事件,详细标注了涉及的物体和发生的时间帧。通过这种方式,SuperCLEVR-Physics为视频问答任务提供了丰富的动态场景理解数据。
特点
SuperCLEVR-Physics数据集的显著特点在于其对动态3D场景的全面捕捉和详细标注。数据集不仅涵盖了物体的静态和动态属性,还特别强调了物理属性和碰撞事件的记录,这为研究者提供了深入分析物体间交互和物理现象的机会。此外,数据集设计了多种类型的问题,包括事实性问题、预测性问题和反事实问题,从而全面评估模型的理解和推理能力。
使用方法
使用SuperCLEVR-Physics数据集时,研究者可以通过运行提供的脚本生成新的场景和视频渲染。首先,设置Python环境和安装必要的依赖包,然后通过执行`run.sh`脚本生成指定数量的视频。每个视频文件夹包含事件和元数据的JSON文件,以及一系列的RGBA图像帧。这些数据可用于训练和评估视频问答模型,特别是那些需要理解和推理动态3D场景的模型。
背景与挑战
背景概述
SuperCLEVR-Physics数据集是由Xingrui Wang等研究人员于2024年创建,旨在推动视频问答(Video Question Answering, VQA)领域的发展。该数据集专注于动态3D场景的理解,通过模拟物体在4D空间中的运动和碰撞事件,提供了丰富的标注信息,包括物体的静态属性(如形状和颜色)、动态属性(如3D位置和速度)以及物理属性(如质量、摩擦力和恢复系数)。这些详细标注不仅有助于提升模型的物理推理能力,还为研究者提供了一个评估和开发新型VQA算法的平台。SuperCLEVR-Physics的推出,标志着在复杂动态场景理解方面迈出了重要一步,对计算机视觉和人工智能领域具有深远影响。
当前挑战
SuperCLEVR-Physics数据集在构建过程中面临多项挑战。首先,生成具有真实物理属性的动态3D场景需要精确的模拟和控制,这要求对物理引擎和渲染技术有深入的理解和应用。其次,数据集的标注过程复杂,需要对每个场景中的物体进行详细的属性标注,包括其动态变化和碰撞事件,这增加了数据处理的难度和时间成本。此外,设计多样化和复杂的问答任务,以测试模型在不同情境下的理解和推理能力,也是一项艰巨的任务。这些挑战不仅考验了数据集构建者的技术能力,也为后续研究者提供了丰富的探索空间。
常用场景
经典使用场景
SuperCLEVR-Physics数据集在视频问答(Video Question Answering, VQA)领域中展现了其独特的应用价值。该数据集通过模拟动态3D场景,提供了丰富的物体属性信息,包括静态属性如形状和颜色,以及动态属性如3D位置、速度和外力作用。这些详细标注使得研究者能够设计并测试关于物体动态行为的各类问题,涵盖事实性、预测性和反事实性问题。通过这些问题的解答,研究者可以深入探索物体在复杂环境中的行为模式,从而推动VQA技术在动态场景理解方面的进步。
实际应用
SuperCLEVR-Physics数据集在实际应用中展现了广泛的前景。首先,它在智能监控系统中具有潜在应用,通过分析监控视频中的物体动态行为,可以实现对异常事件的实时检测和预警。其次,在机器人技术领域,该数据集可以用于训练机器人理解并预测环境中物体的运动轨迹,从而提高其操作的准确性和安全性。此外,在虚拟现实和增强现实应用中,该数据集可以用于生成更加逼真的动态场景,提升用户体验。
衍生相关工作
SuperCLEVR-Physics数据集的发布催生了多项相关研究工作。首先,基于该数据集的物理属性标注,研究者们开发了新的视频问答模型,这些模型能够更准确地预测和解释物体在动态场景中的行为。其次,该数据集促进了物理模拟与计算机视觉的融合研究,推动了新一代物理引擎的开发。此外,SuperCLEVR-Physics还启发了在教育领域的应用,通过模拟物理实验场景,帮助学生更好地理解物理概念。这些衍生工作不仅扩展了数据集的应用范围,也推动了相关领域的技术进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作