Embody 3D
收藏Embody 3D 数据集概述
数据集简介
Embody 3D是由Meta的Codec Avatars Lab推出的多模态3D运动数据集,包含439名参与者的500小时3D运动数据,总计超过5400万帧跟踪的3D运动。数据集涵盖单人多模态运动数据(包括提示动作、手势和移动)以及多人行为和对话数据(如讨论、不同情绪状态下的对话、协作活动和公寓式空间中的共同生活场景)。
数据组成
各章节数据统计
| 章节 | 时长(小时) | 身体形状 | 手部跟踪 | 音频 | 文本 | 多人互动 |
|---|---|---|---|---|---|---|
| Charades | 88.9 | ✔️ | ✔️ | ❌ | ✔️ | ❌ |
| Hand Interactions | 111.3 | ✔️ | ✔️ | ❌ | ❌ | ❌ |
| Locomotion | 21.0 | ✔️ | ✔️ | ❌ | (✔️) | ❌ |
| Dyadic Conversations | 59.4 | ✔️ | ✔️ | ✔️ | (✔️) | ✔️ |
| Multi-Person Conversations | 125.2 | ✔️ | ✔️ | ✔️ | ❌ | ✔️ |
| Scenarios | 49.2 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
| Day in the Life | 46.4 | ✔️ | ✔️ | ✔️ | ✔️ | ✔️ |
注:(✔️)表示仅有高级文本信息(如情绪标注),文本标注位于序列文件名中。
数据特征
核心特征
- 跟踪的人体运动数据(包括手部跟踪和身体形状)
- 文本标注
- 每个参与者的独立音频轨道
文件结构特征
每个捕获目录包含:
videos/- 鸟瞰视角的场景视频missing/- SMPLX帧损坏的二进制指示器smplx_mesh_*/- 渲染网格所需的所有SMPLX特征dataset.json- 每个捕获序列的概览和资产信息
可选特征
text_annotations_holistic/- 描述整个捕获序列的高级文本标注separated_audio/- 说话人分离的音频文件text_annotations/- 描述10秒片段的中级文本标注
数据获取
获取完整数据集需要填写发布表格:https://www.meta.com/emerging-tech/codec-avatars/embody-3d
下载命令: bash python src/download.py --src test_file.txt
支持按特征和类别筛选下载。
技术规格
- 帧率:30fps
- 数据格式:SMPLX模型参数
- 支持多人场景加载
- 最大序列长度默认600帧(20秒)
引用信息
@techreport{mclean2025embody3d, title = {Embody 3D: A Large-scale Multimodal Motion and Behavior Dataset}, author = {Claire McLean and Makenzie Meendering and Tristan Swartz and Orri Gabbay and Alexandra Olsen and Rachel Jacobs and Nicholas Rosen and Philippe de Bree and Tony Garcia and Gadsden Merrill and Jake Sandakly and Julia Buffalini and Neham Jain and Steven Krenn and Moneish Kumar and Dejan Markovic and Evonne Ng and Fabian Prada and Andrew Saba and Siwei Zhang and Vasu Agrawal and Tim Godisart and Alexander Richard and Michael Zollhoefer}, institution = {arXiv}, year = {2025}, type = {Technical Report}, note = {arXiv preprint}, }
许可证
数据集本身采用XRCIA许可证,具体参见数据集网页。



