five

zzcnewly/ContPhy_Dataset

收藏
Hugging Face2024-05-29 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/zzcnewly/ContPhy_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
ContPhy数据集是一个用于从视频中学习和推理连续物理概念的数据集。它包含Mini Dataset和Full Dataset两部分。Mini Dataset包含20个视频及其注释,Full Dataset包含四个子集,分别是fluid_full、rope_full、cloth_full和ball_full,每个子集包含500个视频和1500至2000个问题。数据集的任务类别是问答(question-answering),规模在1K到10K之间。

ContPhy数据集是一个用于从视频中学习和推理连续物理概念的数据集。它包含Mini Dataset和Full Dataset两部分。Mini Dataset包含20个视频及其注释,Full Dataset包含四个子集,分别是fluid_full、rope_full、cloth_full和ball_full,每个子集包含500个视频和1500至2000个问题。数据集的任务类别是问答(question-answering),规模在1K到10K之间。
提供机构:
zzcnewly
原始信息汇总

ContPhy 数据集概述

基本信息

  • 许可证: MIT
  • 任务类别: 问答
  • 数据规模: 1K<n<10K

数据集结构

Mini 数据集

  • 文件: contphy_mini.zip
  • 内容: 每个场景20个视频及标注

完整数据集

  • 文件: fluid_full.zip
    • 内容: 500个视频 + 1500个问题
  • 文件: rope_full.zip
    • 内容: 500个视频 + 2000个问题
  • 文件: cloth_full.zip
    • 内容: 500个视频 + 1500个问题
  • 文件: ball_full.zip
    • 内容: 500个视频 + 1500个问题

引用信息

bibtex @inproceedings{zheng2024contphy, title={ContPhy: Continuum Physical Concept Learning and Reasoning from Videos}, author={Zheng, Zhicheng and Yan, Xin and Chen, Zhenfang and Wang, Jingzhou and Lim, Qin Zhi Eddie and Tenenbaum, Joshua B and Gan, Chuang}, booktitle={International Conference on Machine Learning}, year={2024}, organization={PMLR} }

搜集汇总
数据集介绍
main_image_url
构建方式
在连续介质物理学的背景下,ContPhy数据集的构建采用了系统化的视频生成与标注流程。研究团队通过物理仿真引擎生成了涵盖流体、绳索、布料和球体四种典型场景的动态视频序列,每种场景包含500个独立视频。每个视频均配备了多层次的标注信息,包括物体运动轨迹、物理状态参数以及基于视频内容衍生的问答对,总计生成超过6500个结构化问题,确保了数据在物理概念覆盖上的广度与深度。
特点
该数据集的核心特点在于其专注于连续介质物理概念的视觉化学习与推理。视频内容模拟了真实世界中连续体的复杂动力学行为,如流体的粘滞流动、布料的柔性形变等,提供了高保真的时空动态信息。与之配套的问答任务要求模型从视频序列中推断隐含的物理规律,例如预测物体运动轨迹或解释能量转换过程,从而形成了对物理常识推理能力的多维度评估基准。
使用方法
使用该数据集时,研究者可将其应用于视频理解与物理推理模型的训练与评估。典型流程包括加载特定场景的压缩包,解析视频文件与对应的JSON格式标注,进而构建端到端的问答任务。数据集支持多种机器学习范式,如监督学习下的物理状态预测,或生成式模型中的因果推理,用户可通过官方代码库提供的工具链便捷地实现数据预处理、模型训练与性能验证。
背景与挑战
背景概述
在人工智能与认知科学交叉领域,从视觉观察中理解和推理连续物理现象一直是一项核心挑战。ContPhy数据集由麻省理工学院等机构的研究团队于2024年创建,旨在推动机器对流体、绳索、布料和球体等连续介质物理概念的学习与推理能力。该数据集通过提供包含丰富标注的视频序列及其对应的问题,为构建能够从动态视觉输入中归纳物理规律的模型奠定了数据基础,对物理常识推理和视频理解领域的发展具有重要影响力。
当前挑战
ContPhy数据集致力于解决从视频中学习连续物理概念并进行推理这一复杂问题,其核心挑战在于模型需从高维、连续的视觉动态中抽象出潜在的物理规律,并回答涉及未来预测或反事实推理的问题。在构建过程中,研究团队面临如何精确模拟多样化的连续物理场景并生成高质量、物理一致的视频数据,以及如何设计具有足够深度和多样性的问答对以全面评估模型推理能力的双重挑战。
常用场景
经典使用场景
在连续介质物理学的背景下,ContPhy数据集为视频理解与物理推理的结合提供了经典范例。该数据集通过涵盖流体、绳索、布料和球体四种连续介质场景,构建了包含动态视频与对应问答对的丰富资源。研究者通常利用其视频序列,训练模型从视觉输入中提取物理概念,进而回答涉及连续性物质运动与变形的复杂问题,推动了视觉推理与物理规律学习的深度融合。
实际应用
在实际应用层面,ContPhy数据集为机器人操作、虚拟仿真与教育技术等领域提供了关键支持。例如,在机器人抓取可变形物体的任务中,模型通过学习数据集中布料或绳索的物理特性,能够预测其运动轨迹,从而规划更精准的控制策略。同时,该数据集也可用于开发交互式物理教学工具,帮助学生通过可视化场景直观理解连续介质力学原理,提升科学教育的沉浸感与有效性。
衍生相关工作
围绕ContPhy数据集,已衍生出一系列专注于物理推理与视频理解的经典研究工作。例如,基于该数据集开发的ContPhy-Gen框架,通过生成式模型从视频中学习物理概念表示,并应用于问答推理任务。此外,许多研究借鉴其多场景设计,进一步扩展了针对特定连续介质(如非牛顿流体)的专用数据集,推动了物理启发的神经网络架构与跨模态推理模型的创新与发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作