OmniHuMo
收藏数据集名称:OmniHuMo
数据集概览
- 规模:包含超过 320万 个高质量动作捕捉序列,总时长超过 5,000小时。
- 数据来源:完全从互联网视频中提取。
- 语言:英语(
en)。 - 任务类别:通用(
other)、机器人(robotics)。 - 标签:大型人体运动、人形机器人、人形机器人运动。
数据集内容与结构
- 数据文件:
- 运动数据:
omnihumo_v0.tar.gz(分卷压缩,共6个部分,文件名后缀part_aa至part_af)。 - 音频数据:
audio.tar.gz(分卷压缩,共60个部分,文件名后缀part_aa至part_bh)。 - 音频特征:
audio_feat.tar.gz(分卷压缩,共8个部分,文件名后缀part_aa至part_ah)。 - 数据拆分:
split.tar.gz(单文件)。
- 运动数据:
- 文件结构:
- 根目录包含:
README.md、assets文件夹、所有压缩分卷文件、process_code文件夹、split.tar.gz、upload.py。
- 根目录包含:
数据获取与使用
-
克隆仓库: bash git lfs install git clone https://huggingface.co/datasets/L-yiheng/OmniHuMo
若要跳过大型文件(仅下载指针),使用: bash GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/datasets/L-yiheng/OmniHuMo
-
解压数据:使用以下命令解压各分卷压缩包: bash cat ./audio_feat.tar.gz.part_* | pigz -d -p 64 | tar -xvf - cat ./audio.tar.gz.part_* | pigz -d -p 64 | tar -xvf - cat ./omnihumo_v0.tar.gz.part_* | pigz -d -p 64 | tar -xvf - tar -xzf split.tar.gz
许可协议
- 许可类型:CC BY-NC-SA 4.0(知识共享-署名-非商业性使用-相同方式共享 4.0 国际许可协议)。
- 社区许可协议:访问该数据集需要同意“OmniHuMo 社区许可协议”,并在申请时提供以下信息:
- 姓名(First Name / Last Name)
- 电子邮箱
- 国家
- 所属机构
- 电话号码
- 工作职位(学生、研究毕业生、AI研究员、AI开发者/工程师、记者、其他)
- 研究兴趣
引用
若该数据集对研究有帮助,请引用以下论文: text @misc{li2026anymoscalinganymodalityconditional, title={AnyMo: Scaling Any-Modality Conditional Motion Generation with Masked Modeling}, author={Yiheng Li and Zhuo Li and Ruibing Hou and Yingjie Chen and Hong Chang and Hao Liu and Shiguang Shan}, year={2026}, eprint={2605.29488}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2605.29488}, }




