MotionHalluc
收藏MotionHalluc Benchmark 数据集概述
基本信息
- 数据集名称:MotionHalluc Benchmark
- 许可证:CC BY 4.0(仅限非商业科研用途)
- 任务类型:视觉问答(Visual Question Answering)、其他(运动推理)
- 语言:英语
- 标签:运动推理、视频理解、人体运动、基准测试
- 数据集规模:1,000 < N < 10,000 个样本
数据集简介
MotionHalluc 是一个专为评估视频多模态模型在运动幻觉和运动推理能力而设计的基准数据集。它包含三个评估任务,要求模型在不同视频之间对人体运动模式进行比较、推理和验证。
数据集结构
1. MotionHalluc/ 目录
- 包含所有注释文件
- 提供三种 MotionHalluc 任务(基于问答的评估)
- 包含用于构建基准的原始精选注释
- 文件格式:JSON
2. motion_4dHumans/ 目录
- 包含每个视频样本对应的运动表征数据
- 文件格式:
.npy - 运动表征使用预训练的4D人体运动重建管线提取
- 每个文件对应问答注释中使用的视频ID
视频数据说明
- 数据集仅分发注释和运动表征,不包含原始视频
- 用户需自行从 Fit3D 数据集下载原始视频:https://fit3d.imar.ro/
- 视频仅用作运动提取和评估对齐的输入参考
运动提取方法
运动表征采用预训练的 4D 人体运动重建方法提取(Goel 等,2023),该方法从视频输入中提取 3D 人体运动轨迹。
基准使用示例
每个样本包含:
- 关于运动比较或推理的问题
- 多项选择或二选一的答案
- 每个视频对应的运动表征
JSON 格式示例: json { "0001": { "v1": "Bench/s03/band_pull_apart/band_pull_apart_front_215_304.mp4", "v2": "Bench/s04/band_pull_apart/band_pull_apart_front_236_345.mp4", "q": "You are given a query motion in Video1 and a reference motion in Video2. Which of the following correction accurate and necessary to improve the query motion in Video1 based on the reference motion in Video2?", "c": [ "Hands level with your head at the beginning", "At the beginning, keep your hands below head level" ], "a": "A" } }
预处理与评估代码
官方代码仓库提供视频预处理和评估脚本,包括:
- 视频预处理管线
- 三个 MotionHalluc 任务的评估脚本
- 准确率计算脚本
GitHub 代码仓库:https://anonymous.4open.science/r/MotionHalluc-4E96
Fit3D 真实运动数据处理
- 因数据集许可限制,不重新分发 Fit3D 导出的运动数据
- 完整 Fit3D 真实运动处理管线将在论文接收后发布
- 当前版本使用 4D-Humans 运动表征进行评估
引用
该基准使用了 Fit3D 数据集和 4D-Human 方法,相关引用信息请参见原始页面。




