DogMo
收藏arXiv2025-10-28 更新2025-10-30 收录
下载链接:
https://pie-lab.cn/DogMo/
下载链接
链接失效反馈官方服务:
资源简介:
DogMo是一个大规模的多视图RGB-D视频数据集,用于从图像中恢复犬类运动的任务。该数据集由10只独特犬类的1200个运动序列组成,提供丰富的运动和品种变化。它解决了现有犬类运动数据集的关键局限性,包括缺乏多视图和真实的3D数据,以及规模和多样性的限制。
DogMo is a large-scale multi-view RGB-D video dataset developed for the task of recovering canine motion from images. It comprises 1200 motion sequences from 10 distinct dog subjects, showcasing rich variations in both motion patterns and breed types. This dataset addresses the critical limitations of existing canine motion datasets, including the absence of multi-view and ground-truth 3D data, as well as restrictions on dataset scale and diversity.
提供机构:
北京理工大学计算机科学与技术学院
创建时间:
2025-10-28
原始信息汇总
DogMo: 大规模多视角RGB-D犬类运动恢复数据集
数据集概述
DogMo是一个大规模多视角RGB-D视频数据集,专门用于从图像中进行犬类运动恢复研究。该数据集包含1.2k个运动序列,采集自10只不同的狗,在运动和品种方面都具有丰富的多样性。
核心特点
- 多模态数据:包含RGB、深度图、掩码和关键点等多种数据类型
- 大规模多样性:解决了现有犬类运动数据集在多视角、真实3D数据、规模和多样性方面的局限性
- 基准设置:建立了四个运动恢复基准设置,支持单目和多视角、RGB和RGB-D输入的系统性评估
动作类别
- Sit(坐)
- Stand Up(站立)
- Get On Chair(上椅子)
- Play With Toy(玩玩具)
- Play With Human(与人互动)
技术方法
提出了一个三阶段、实例特定的优化流程,将SMAL模型拟合到运动序列中,通过粗对齐、密集对应监督和时间正则化逐步优化身体形状和姿态。
引用信息
bibtex @article{wang2025dogmo, title={DogMo: A Large-Scale Multi-View RGB-D Dataset for 4D Canine Motion Recovery}, author={Wang, Zan and Chen, Siyu and Mo, Luya and Gao, Xinfeng and Shen, Yuxin and Ding, Lebin and Liang, Wei}, journal={arXiv preprint arXiv:2510.24117}, year={2025} }
搜集汇总
数据集介绍

构建方式
在动物运动分析领域,数据采集常受限于设备成本与动物行为不可控性。DogMo数据集通过部署五台低成本ORBBEC Astra 2 RGB-D相机构建环形采集系统,以2.5米半径均匀分布并同步校准,在室内受控环境中记录犬类自然行为。训练师通过语义指令引导10只不同品种犬只完成跑动、跳跃等11类动作,确保每段序列至少被三个视角完整捕捉,最终积累1200段运动序列,总时长超220分钟,涵盖1920×1080分辨率RGB流与1600×1200深度流数据。
使用方法
为支持系统性研究,数据集构建了四类运动恢复基准设定:单目RGB、多视角RGB、单目RGB-D及多视角RGB-D输入。研究者可基于标准化标注开发或验证算法,例如通过实例分割掩码与关键点实现模型粗对齐,利用深度点云监督三维形状重建,或借助多视角一致性约束提升姿态估计精度。配套提供的三阶段优化流程进一步演示了如何从粗到细迭代优化SMAL模型参数,其中时序平滑性约束可有效缓解单目输入下的运动抖动问题。
背景与挑战
背景概述
随着计算机视觉技术在人体运动恢复领域取得显著进展,动物运动分析逐渐成为新兴研究方向。DogMo数据集由北京理工大学团队于2025年提出,旨在解决犬类运动恢复领域的数据匮乏问题。该数据集通过五台同步RGB-D相机采集了10只不同品种犬类的1200个运动序列,涵盖11种动作类型,总时长超过220分钟。其创新性在于首次实现了多视角RGB-D数据的大规模采集,为动物行为建模与虚拟资产创建提供了重要基础。
当前挑战
在领域问题层面,犬类运动恢复面临体型差异导致的模型泛化难题,以及毛发覆盖造成的身体部位定位模糊问题。构建过程中需克服动物不可控性带来的数据采集效率低下挑战,同时需解决多相机同步校准与遮挡处理等技术难点。现有方法在单目RGB输入下存在三维形状恢复的固有歧义,而深度信息的缺失进一步限制了运动轨迹的精确重建。
常用场景
经典使用场景
在计算机视觉与动物行为建模交叉领域,DogMo数据集为犬类四维运动恢复研究提供了标准化基准。该数据集通过五台同步RGB-D相机捕获的1.2千个运动序列,支持从单目到多视角、从RGB到RGB-D输入的四种典型评估场景,成为验证运动重建算法精度的核心实验平台。其多模态特性使得研究者能够系统评估三维姿态估计、时序运动建模等任务的性能表现,为动物运动分析建立了严谨的量化标准。
解决学术问题
DogMo有效解决了动物运动分析领域长期存在的三维数据缺失与多样性不足问题。通过提供真实三维空间信息与多视角同步观测,该数据集显著降低了单目重建中的尺度歧义性,为研究犬类肢体运动学提供了精确的几何约束。其涵盖10种犬科动物与11类动作的多样性设计,突破了传统数据在运动模式与个体差异方面的局限性,为构建泛化性强的运动先验模型奠定了数据基础。
实际应用
在虚拟制作与生物力学研究领域,DogMo支持高精度犬类运动数字化重建,为影视动画制作提供真实可信的角色运动素材。宠物健康监测场景中,基于该数据集的运动分析技术可辅助兽医进行步态异常检测与康复评估。机器人仿生学应用方面,犬类运动模式的数字化解析为四足机器人运动控制提供了生物力学参考,推动智能体在复杂地形中的自适应运动能力发展。
数据集最近研究
最新研究方向
随着计算机视觉技术在动物行为分析领域的深入应用,犬类运动恢复研究正迎来重要突破。DogMo数据集作为首个大规模多视角RGB-D犬类运动数据集,填补了现有数据在三维信息、多视角覆盖和数据规模方面的空白。该数据集通过5个同步低成本相机采集了10只不同品种犬类的11种动作类型,总时长超过220分钟,为基于单目/多视角、RGB/RGB-D输入的四种运动恢复基准设定提供了坚实基础。前沿研究聚焦于扩展参数化模型D-SMAL的体型适应能力,并开发三阶段优化流程:通过粗对齐初始化全局位姿,利用密集对应监督解决毛发纹理模糊问题,结合时序正则化提升运动连贯性。这一技术路线在虚拟资产创建、动物行为量化分析等领域展现出广阔应用前景,推动了计算机视觉与生物力学研究的跨学科融合。
相关研究论文
- 1DogMo: A Large-Scale Multi-View RGB-D Dataset for 4D Canine Motion Recovery北京理工大学计算机科学与技术学院 · 2025年
以上内容由遇见数据集搜集并总结生成



