MotionHub Dataset

github2025-12-22 更新2025-12-23 收录

下载链接：

https://github.com/ZeyuLing/MotionHub

下载链接

链接失效反馈

官方服务：

资源简介：

MotionHub是一个统一的多领域运动数据集集合。所有运动序列都转换为Blender-ready SMPLX-55 npz文件（缺失的手/头部关节使用零SMPL姿势系数作为默认姿势）。

MotionHub is a unified collection of multi-domain motion datasets. All motion sequences are converted into Blender-ready SMPLX-55 npz files, where missing hand and head joints use zero SMPL pose coefficients as their default poses.

创建时间：

2025-12-20

原始信息汇总

MotionHub 数据集概述

数据集简介

MotionHub 是一个跨多个领域的统一运动数据集集合。所有运动序列均被转换为适用于 Blender 的 SMPLX-55 npz 文件（缺失的手部/头部关节使用零 SMPL 姿态系数以保持默认姿态）。

数据集子集详情

单人文本-运动子集

子集	包含手部	描述来源	运动质量	运动风格	备注
AMASS_SUP	是	手动 + LLM	优秀	多样（舞蹈/日常/健身）	动作捕捉非常精确；无跳跃/穿透伪影
CombatMotion	否	原始 + LLM	中等	游戏风格动作	存在一些相互穿透；快速运动可能存在位移不准确
Fit3D	是	手动 + LLM	优秀	健身动作	—
Human36M	否	Gemini 2.5 自动生成	中等	日常动作	单目动作捕捉；身体通过GVHMR，手部通过AiOS；整体质量一般
HumanAct12	否	原始 + LLM	中等	日常动作	逆向运动学源自HumanML3D相关数据
HumanSC3D	否	手动 + LLM	优秀	日常动作	—
MotionX++	是	原始 + LLM	中等	混合日常/运动	混合来源；部分单目动作捕捉；总体质量一般；部分描述由VLM自动提取，相关性较低
NTURGBD120	否	动作标签 + LLM	中等	日常动作	单目动作捕捉；身体通过GVHMR，手部通过AiOS
PerMo	是	原始 + LLM	优秀	风格化日常	高度风格化的日常动作；高质量；原始描述为简单模板，由LLM重写
Trumans	是	原始 + LLM	优秀	日常交互	包含源数据集提供的3D场景和物体
UESTC	否	动作标签 + LLM	中等	日常动作	源数据抖动严重；已平滑处理；整体质量一般

双人文本-运动子集

子集	包含手部	描述来源	运动质量	运动风格	备注
CHI3D	是	手动 + LLM	中等	交互/运动	存在相对位置误差；整体可用
Hi4D	否	手动 + LLM	优秀	紧密交互	高质量
InterHuman	否	原始/手动 + LLM	中等	交互/运动	交互精度较低；常见穿透；双人描述通过手动+LLM分解为单人描述
InterX	是	原始 + LLM	优秀	交互/运动	高质量

舞蹈运动子集

子集	包含手部	描述来源	运动质量	风格	备注
AIST++	否	手动 + LLM	高	音乐舞蹈	轻微跳跃/穿透；整体高质量
FineDance	是	手动 + LLM	优秀	细粒度舞蹈	—

说话运动子集

子集	包含手部	描述来源	运动质量	风格	备注
BEAT v2.0	是	手动 + LLM	优秀	说话手势	无可观察缺陷
TED	否	Gemini 2.5 自动生成	高	说话/伴随语音	单目动作捕捉；身体通过GVHMR，手部通过AiOS；身体质量良好；描述由Gemini自动提取

完整数据集归档

完整下载链接： https://1drv.ms/f/c/aa7c4b840465cd9b/IgAQ3c9R5qjMSaOpkLTSvhrxAeUxaIxoNUdurK0in-souu0?e=sYWYxO

引用要求

若 MotionHub 对您的研究有所帮助，请同时引用 MotionHub 以及您所使用的特定子集。各子集的引用信息详见数据集详情页面的“Citations”部分。

搜集汇总

数据集介绍

构建方式

在三维人体运动建模领域，MotionHub数据集通过系统整合多个权威子集构建而成。该数据集将原始运动序列统一转换为Blender兼容的SMPLX-55格式npz文件，确保了数据格式的一致性。构建过程中，针对缺失手部或头部关节的情况，采用零SMPL姿态系数进行默认姿态填充。数据标注来源多样，结合了人工标注、原始动作标签以及大语言模型自动生成技术，涵盖了单人与双人交互、舞蹈、言语动作等多种运动模态。

特点

MotionHub数据集以其跨域统一性与高质量标注著称。数据集囊括了从日常动作、健身训练到舞蹈表演、人际交互等丰富运动风格，动作质量从优秀到中等均有覆盖，部分子集提供了精确的动捕数据且无跳跃或穿透伪影。数据特点在于其细致的模态划分，不仅包含全身运动，还特别标注了手部动作信息，并通过大语言模型对原始描述进行了语义增强，提升了文本-运动对齐的准确性。

使用方法

该数据集主要服务于文本驱动运动生成、动作识别与人机交互等研究方向。使用者可通过提供的统一数据链接下载完整档案或按需选择特定子集。数据以npz格式存储，可直接导入Blender或主流深度学习框架进行预处理。在研究应用中，建议同时引用MotionHub整体数据集及所使用的具体子集原始文献，以确保学术贡献的完整追溯。数据集的标准化格式与丰富模态为开发跨场景运动合成模型提供了坚实基础。

背景与挑战

背景概述

在计算机视觉与图形学领域，高质量、大规模的人体运动数据对于推动动作生成、行为理解及人机交互等研究方向至关重要。MotionHub数据集作为一个统一的多领域运动数据集合，由研究社区在近年整合构建，其核心目标在于解决现有运动数据分散、格式不一且标注质量参差不齐的瓶颈问题。该数据集汇聚了来自AMASS、Human3.6M、AIST++等多个知名子集的运动序列，并统一转换为Blender可用的SMPLX-55格式，涵盖了单人动作、双人交互、舞蹈以及语音伴随手势等多种丰富场景。通过集成手动与大型语言模型生成的文本描述，MotionHub致力于为文本驱动运动生成、运动重建及跨模态学习提供标准化、高质量的基准资源，显著促进了三维人体运动分析领域的算法发展与模型训练。

当前挑战

MotionHub数据集所应对的核心领域挑战在于三维人体运动的精细建模与跨模态对齐，即如何从文本描述生成自然、多样且符合物理规律的人体动作序列。具体而言，运动数据本身常存在关节穿透、运动抖动及位移不准确等噪声问题，尤其在快速动作或复杂交互中更为显著。在数据集构建过程中，挑战主要体现在多源数据的质量异构性与标注一致性上：不同子集采集于各异的环境与设备，导致运动质量从优秀到中等分布不均；部分数据依赖单目运动捕捉技术，可能引入重建误差；同时，文本描述来源多样，包括原始标签、手动注释及大语言模型自动生成，其与运动序列的相关性与准确性仍需进一步优化以确保跨模态学习的可靠性。

常用场景

经典使用场景

在三维人体运动生成与理解的研究领域，MotionHub数据集凭借其统一格式的SMPLX-55参数化表示，为文本驱动运动生成任务提供了经典的应用场景。该数据集整合了舞蹈、日常活动、健身、格斗以及人际交互等多领域运动序列，并辅以人工标注与大型语言模型生成的文本描述，使得研究人员能够训练跨模态模型，实现从自然语言指令到高质量、多样化人体动作的端到端合成。

解决学术问题

MotionHub数据集有效应对了三维人体运动分析中长期存在的模态割裂与数据稀缺挑战。它通过标准化处理将来自AMASS、Human3.6M、NTU RGB+D 120等异构源数据的运动序列转化为统一表征，解决了不同数据集之间格式不一、难以联合使用的难题。其丰富的文本-运动配对数据为监督学习提供了坚实基础，显著推进了动作识别、运动预测、生成模型等方向的研究，为构建通用化的人体运动理解模型奠定了关键的数据基石。

衍生相关工作

围绕MotionHub所整合的丰富子集，学术界已衍生出一系列经典研究工作。例如，基于AIST++数据的音乐条件舞蹈生成模型“AI Choreographer”，利用BEAT数据集进行对话手势合成的相关研究，以及依托InterHuman等交互子集开发的多人生成模型InterGen。这些工作不仅验证了各子集数据的价值，更推动了文本到运动（Text-to-Motion）、音乐到舞蹈（Music-to-Dance）以及人际交互生成（Multi-human Interaction Generation）等多个前沿方向的快速发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集