3DDogs-Lab 和 3DDogs-Wild

Name: 3DDogs-Lab 和 3DDogs-Wild
Creator: 视觉、语音和信号处理中心 (CVSSP)
Published: 2024-06-20 23:33:39
License: 暂无描述

arXiv2024-06-20 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2406.14412v1

下载链接

链接失效反馈

官方服务：

资源简介：

3DDogs-Lab 和 3DDogs-Wild 数据集由英国萨里大学的视觉、语音和信号处理中心（CVSSP）创建，专注于从单目野外图像中进行3D犬类姿态估计。3DDogs-Lab 数据集包含64只狗的运动捕捉数据，最终可用数据为143个记录，使用多种传感器技术如光学标记、IMUs和RGBD相机。为了增强数据集的实用性和代表性，创建了3DDogs-Wild数据集，通过移除光学标记和增加多样化的背景，使其更适用于训练基于RGB图像的姿态检测器。这些数据集主要用于解决动物姿态估计中的深度歧义问题，并推动3D动物姿态估计技术的发展。

3DDogs-Lab and 3DDogs-Wild datasets were developed by the Centre for Vision, Speech and Signal Processing (CVSSP) at the University of Surrey, UK, focusing on 3D canine pose estimation from monocular in-the-wild images. The 3DDogs-Lab dataset contains motion capture data of 64 dogs, with 143 valid records in total, leveraging multiple sensing technologies including optical markers, IMUs and RGBD cameras. To enhance the practicality and representativeness of the dataset suite, the 3DDogs-Wild dataset was constructed by removing optical markers and adding diverse backgrounds, making it more suitable for training RGB-image-based pose detectors. These datasets are primarily intended to resolve the depth ambiguity issue in animal pose estimation and advance the development of 3D animal pose estimation technologies.

提供机构：

视觉、语音和信号处理中心 (CVSSP)

创建时间：

2024-06-20

搜集汇总

数据集介绍

构建方式

3DDogs-Lab 和 3DDogs-Wild 数据集的构建采用了多种传感器技术，包括基于光学标记的运动捕捉系统、RGBD 相机、IMU 和压力垫。在室内环境下，该数据集记录了各种犬种在走道上的小跑动作，从而提供了高质量的运动数据。为了解决光学标记的存在和背景多样性有限的问题，研究团队创建了 3DDogs-Wild 数据集，这是一个自然化的版本，其中光学标记被擦除，并且主体被放置在不同的环境中，从而增强了其在训练基于 RGB 图像的姿态检测器方面的实用性。通过这种方式，3DDogs-Wild 数据集更加贴近现实世界的条件，为研究提供了更具代表性的数据。

特点

3DDogs-Lab 数据集提供了高精度的运动捕捉数据，但由于光学标记的存在和背景的单一性，其现实世界代表性有限。而 3DDogs-Wild 数据集通过擦除光学标记和更换背景，使其更加接近自然环境，从而提高了数据集的现实世界适用性。此外，该数据集包含了 37 个主体的 286 个序列和 12,940 个帧，为研究提供了丰富的数据资源。

使用方法

使用 3DDogs-Lab 和 3DDogs-Wild 数据集时，研究人员可以进行姿态估计模型的训练和评估。通过比较在 3DDogs-Wild 和 3DDogs-Lab 数据集上训练的模型的性能，可以评估模型在不同数据集上的泛化能力。此外，研究人员还可以使用 3DDogs-Wild 数据集来训练模型，并将其应用于现实世界中的犬种姿态估计任务。通过这种方式，3DDogs-Lab 和 3DDogs-Wild 数据集为研究提供了有价值的资源和工具。

背景与挑战

背景概述

3DDogs-Lab 和 3DDogs-Wild 数据集的研究背景主要围绕单目3D犬类姿态估计展开。这两个数据集分别由Moira Shooter、Charles Malleson和Adrian Hilton等研究人员在Centre for Vision, Speech and Signal Processing (CVSSP) of the University of Surrey于2024年6月20日创建。研究旨在解决传统多传感器系统如运动捕捉（mocap）在分析动物步态时存在的侵入性、设置复杂等问题，转而关注于使用机器学习技术进行单目和无标记的估计方法。这些方法具有简单、非侵入性等优点，但现有的模型在应用于自然环境中时往往无法泛化，存在领域差距问题。为此，研究人员创建了3DDogs-Lab数据集，它包含了来自光学标记运动捕捉系统、RGBD相机、IMU和压力垫的数据，但室内环境和光学标记的存在限制了其在现实世界条件下的代表性。为了弥补这一缺陷，研究人员进一步开发了3DDogs-Wild数据集，通过去除光学标记并在多样化的环境中放置犬类，使其更贴近自然条件。这两个数据集的创建对推进3D动物姿态估计研究具有重要影响。

当前挑战

3DDogs-Lab 和 3DDogs-Wild 数据集面临的挑战主要包括：1)解决领域问题：这两个数据集旨在解决单目3D犬类姿态估计问题，特别是在现实世界条件下，由于环境多样性和动物行为的不可预测性，这一任务具有挑战性；2)构建过程中的挑战：在构建3DDogs-Wild数据集时，研究人员面临着如何去除光学标记并创建多样化背景的挑战，以及如何确保数据集的准确性和一致性。此外，由于动物行为的不可预测性，捕捉到高质量的3D数据集也是一个挑战。

常用场景

经典使用场景

3DDogs-Lab 和 3DDogs-Wild 数据集主要用于评估和训练单目 3D 狗的姿态估计模型。通过在受控环境中捕获各种狗品种 trotting 的运动数据，并结合多种传感器（如基于光标的运动捕捉系统、RGBD 摄像头、IMU 和压力垫）的数据，该数据集提供了高质量的 3D 运动数据。然而，由于光标的存在和背景多样性的限制，这些数据在真实世界中的应用受到限制。为了解决这个问题，研究人员创建了 3DDogs-Wild 数据集，这是一个自然化的版本，其中光标被擦除，主体被放置在不同的环境中，从而增强了其在训练基于 RGB 图像的姿态检测器方面的实用性。

解决学术问题

3DDogs-Lab 和 3DDogs-Wild 数据集解决了在真实环境中进行 3D 动物姿态估计的挑战。现有的 3D 数据集主要是在受控环境中使用多视图系统捕获的，而真实世界中的环境条件与这些受控环境之间存在显著差异。通过创建一个自然化的数据集，研究人员可以训练模型以更好地泛化到真实世界的数据。此外，该数据集还提供了一种评估模型性能的基准，从而帮助研究人员了解现有姿态估计技术的优势和局限性。

衍生相关工作

3DDogs-Lab 和 3DDogs-Wild 数据集的发布激发了更多相关研究，包括创建其他动物物种的 3D 姿态数据集，以及开发更先进的姿态估计模型。例如，Animal3D 数据集是一个全面的 3D 动物姿态和形状数据集，它包含了多种动物物种的数据。此外，研究人员还探索了使用合成数据训练姿态估计模型的方法，以解决真实世界数据稀缺的问题。这些相关工作为 3D 动物姿态估计领域的发展提供了重要的推动力。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集