five

Multimodal Human Video Dataset

收藏
arXiv2025-09-30 收录
下载链接:
https://chain-of-modality.github.io
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含人类操作任务的视频,结合了肌肉活动与音频信号,旨在使机器人能够学习任务规划和控制参数。该数据集用于评估各种视觉语言模型在不同任务上的表现,如按方块、插入插头、击鼓和开瓶等。其规模涉及多项任务,每项任务有10个测试视频,包含不同的物体和摄像机视角。任务内容为多模态视频分析及现实世界中的机器人评估。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作