AP-10K

arXiv2021-11-01 更新2024-07-31 收录

下载链接：

https://github.com/AlexTheBad/AP10K

下载链接

链接失效反馈

官方服务：

资源简介：

AP-10K是一个大规模的哺乳动物姿态估计基准，包含10,015张从23个动物家族和54个物种中收集并筛选出的图像，具有高质量的关键点标注，旨在促进动物姿态估计的研究。

AP-10K is a large-scale mammal pose estimation benchmark, comprising 10,015 images collected and filtered from 23 animal families and 54 species, featuring high-quality keypoint annotations, and is designed to advance the research in animal pose estimation.

创建时间：

2021-08-28

原始信息汇总

AP-10K 数据集概述

数据集简介

名称: AP-10K
用途: 动物姿态估计研究
特点: 首个大规模通用动物姿态估计数据集
包含内容:
- 10,015张图像（23个动物科，54个物种）
- 高质量关键点标注
- 约50k额外图像（带科和物种标签）
标注格式: COCO风格

关键点定义

数量: 17个关键点

详细定义:

关键点ID	描述	关键点ID	描述
1	左眼	2	右眼
3	鼻子	4	颈部
5	尾根	6	左肩
7	左肘	8	左前爪
9	右肩	10	右肘
11	右前爪	12	左髋
13	左膝	14	左后爪
15	右髋	16	右膝
17	右后爪

数据背景

背景类型:

ID 背景类型 ID 背景类型

1 草地或热带草原 2 森林或灌木

3 泥地或岩石 4 雪地

5 动物园或人类居住地 6 沼泽或河边

7 沙漠或戈壁 8 特写镜头

下载信息

下载链接:
- Google Drive
- 百度网盘 (提取码: 6uz6)
完整版下载:
- Google Drive
- 百度网盘 (提取码: 5lxi)

训练代码

基础框架: mmpose
安装: 参考mmpose安装指南
数据集准备: 解压至data/ap10k目录
预训练模型:

关键问题

创建目的: 研究动物姿态估计中的关键问题，如模型性能、表示能力、预训练影响等。
数据清洗: 使用aHash算法检测相似图像并手动检查，去除遮挡严重和有logo的图像。
关键点标注: 经过三轮交叉检查和校正，确保标注质量。
关键点统一性: 根据动物行走类型调整关键点定义，保持视觉一致性。
适用任务: 动物姿态估计、少样本学习、域泛化、自监督学习等。

许可证

许可证类型: CC-BY-4.0

引用

bibtex @inproceedings{yu2021ap, title={AP-10K: A Benchmark for Animal Pose Estimation in the Wild}, author={Yu, Hang and Xu, Yufei and Zhang, Jing and Zhao, Wei and Guan, Ziyu and Tao, Dacheng}, booktitle={Thirty-fifth Conference on Neural Information Processing Systems Datasets and Benchmarks Track (Round 2)}, year={2021} }

相关项目

APT-36K: 动物姿态估计与跟踪的大规模基准

搜集汇总

数据集介绍

构建方式

AP-10K数据集的构建始于从多个公开动物数据集中收集图像，包括African Wildlife、Animal-Pose Dataset等。随后，通过使用aHash算法和人工检查的方式，去除了重复和错误标注的图像。最终，收集到的图像根据分类等级进行了重新组织和标注，共包含了23个动物科和54个物种。此外，还邀请了13位标注员对每个图像中的动物实例进行仔细标注，包括17个关键点的位置和8种背景类别，以确保数据集的质量。为了满足不同学习场景的需求，数据集还包含了约5万张仅标注了动物科和物种标签的图像。

使用方法

使用AP-10K数据集进行动物姿态估计研究时，首先需要根据研究目的选择合适的训练集、验证集和测试集。其次，可以选择合适的模型架构和训练策略，例如HRNet、SimpleBaseline等。在训练过程中，可以采用Adam优化器和步进式学习率调整策略。此外，还可以通过在ImageNet上预训练模型的方式来加速收敛速度和提高模型性能。最后，可以使用平均平均精度（mAP）等指标来评估模型在数据集上的性能。

背景与挑战

背景概述

动物姿态估计作为理解动物行为的关键步骤，在野生动物保护等领域具有重要意义。然而，现有的动物姿态估计研究主要集中在特定物种，忽略了动物种类的多样性，限制了其泛化能力。为解决这一问题，AP-10K数据集应运而生，该数据集由西安电子科技大学、悉尼大学和京东探索研究院的联合研究团队创建于2021年11月。AP-10K包含来自23个动物科和54个物种的10,015张高质量图像，以及手动标注的关键点注释，为哺乳动物姿态估计研究提供了一个大规模的基准。该数据集的创建填补了动物姿态估计领域缺乏大型基准数据集的空白，对相关领域的研究产生了重要影响。

当前挑战

尽管AP-10K数据集为动物姿态估计研究提供了宝贵的资源，但仍面临一些挑战。首先，动物姿态估计领域问题本身的挑战在于收集和标注大规模的基准数据集，特别是考虑到动物种类的多样性和标注所需的专业知识。其次，构建数据集过程中遇到的挑战包括图像的清洗、分类和标注，以及确保标注质量的一致性和准确性。此外，AP-10K数据集的创建也为未来的研究提出了新的方向，例如半监督学习和自监督学习在动物姿态估计中的应用，以及针对稀有物种的少样本学习等。

常用场景

经典使用场景

动物姿态估计在野生动物保护、动物园管理和动物行为研究中扮演着重要角色。AP-10K数据集作为首个大规模哺乳动物姿态估计基准，为相关研究提供了宝贵的资源。该数据集包含来自23个动物科和54个物种的10,015张图像，以及高质量的关节点注释。研究者可以利用AP-10K数据集训练和评估各种姿态估计模型，从而更好地理解动物行为，例如识别动物的姿态、运动轨迹和社交互动。此外，AP-10K数据集还支持跨域迁移学习，即将人类姿态估计模型应用于动物姿态估计任务，从而提高模型的泛化能力。

解决学术问题

AP-10K数据集解决了动物姿态估计领域长期存在的两个关键问题：1) 缺乏大规模基准数据集，限制了模型的评估和比较；2) 缺乏跨物种泛化能力，限制了模型在实际应用中的实用性。AP-10K数据集的建立为动物姿态估计研究提供了新的方向，并促进了相关技术的发展。该数据集的规模和多样性使得研究者可以更全面地评估模型的性能，并探索跨物种泛化的有效方法。

实际应用

AP-10K数据集的实际应用场景包括：1) 野生动物保护：通过识别动物姿态和运动轨迹，可以监测动物的生存状况和活动范围，从而制定更有效的保护措施；2) 动物园管理：通过分析动物行为，可以优化动物的饲养环境和福利条件，提高动物园的管理水平；3) 动物行为研究：通过研究动物姿态和运动模式，可以揭示动物的社会结构、沟通方式和认知能力。

数据集最近研究

ID	背景类型	ID	背景类型
1	草地或热带草原	2	森林或灌木
3	泥地或岩石	4	雪地
5	动物园或人类居住地	6	沼泽或河边
7	沙漠或戈壁	8	特写镜头