five

PoseScript

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/PoseScript
下载链接
链接失效反馈
官方服务:
资源简介:
自然语言在许多计算机视觉任务中被利用,例如图像字幕,跨模式检索或视觉问答,以提供细粒度的语义信息。虽然人类姿势是人类理解的关键,但当前的3D人类姿势数据集缺乏详细的语言描述。在这项工作中,我们介绍了PoseScript数据集,该数据集将来自AMASS的数千个3D人体姿势与对身体部位及其空间关系的丰富的人类注释描述配对。为了将此数据集的大小增加到与典型的数据饥饿学习算法兼容的规模,我们提出了一个精心设计的字幕过程,该过程从给定的3D关键点以自然语言生成自动合成描述。此过程使用3D关键点上的一组简单但通用的规则来提取低级姿势信息 (posecdes)。然后使用句法规则将posecdes组合为更高级别的文本描述。自动注释大大增加了可用数据量,并可以有效地对深层模型进行预训练以对人类字幕进行微调。为了演示带注释的姿势的潜力,我们展示了PoseScript数据集在从大规模数据集中检索相关姿势以及基于文本姿势描述的合成姿势生成中的应用。
提供机构:
OpenDataLab
创建时间:
2022-11-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作