five

APTv2

收藏
Hugging Face2025-11-13 更新2025-11-14 收录
下载链接:
https://huggingface.co/datasets/DenisKochetov/APTv2
下载链接
链接失效反馈
官方服务:
资源简介:
APTv2是一个大规模的动物姿态估计和跟踪基准数据集,包含30个物种的84611个动物实例的2万749个视频片段(共41235帧)。该数据集提供了高质量的关节点和跟踪标注,适用于单帧姿态估计、少量数据泛化和姿态跟踪等任务。
创建时间:
2025-11-11
原始信息汇总

APTv2 数据集概述

数据集简介

APTv2 是一个大规模动物姿态估计与追踪基准数据集,涵盖 30 个物种。该数据集为 84,611 个动物实例提供高质量关键点和追踪标注,涵盖 2,749 个视频片段(总计 41,235 帧)。

数据规模

  • 视频总数:2,749
  • 每片段帧数:15
  • 总帧数:41,235
  • 标注实例数:84,611
  • 物种数量:30

追踪任务

  1. 单帧姿态估计
  2. 低数据泛化
  3. 姿态追踪

引用信息

bibtex @misc{yang2023aptv2, title={APTv2: Benchmarking Animal Pose Estimation and Tracking with a Large-scale Dataset and Beyond}, author={Yuxiang Yang and Yingqi Deng and Yufei Xu and Jing Zhang}, year={2023}, eprint={2312.15612}, archivePrefix={arXiv}, primaryClass={cs.CV} }

参考文献

  • 原始论文:https://arxiv.org/abs/2312.15612
  • 代码仓库:https://github.com/ViTAE-Transformer/APTv2

许可信息

  • 许可证:Apache-2.0
搜集汇总
数据集介绍
main_image_url
构建方式
在动物行为分析领域,APTv2数据集通过系统化采集与标注流程构建而成。研究团队从自然场景中选取了30个代表性物种,采集了2,749段视频片段并从中提取41,235帧有效图像。采用专业标注工具对84,611个动物实例进行关键点标注,每个视频片段固定包含15个连续帧,确保了时间序列数据的完整性。标注过程严格遵循跨物种一致性原则,为姿态估计与追踪任务提供了高质量的基准数据。
特点
该数据集最显著的特征在于其跨物种的广泛覆盖性与多任务适用性。涵盖30个不同物种的动物姿态数据,既包含静态单帧姿态标注,也具备连续帧间的追踪标识。数据规模达到八万余个标注实例,在保持物种多样性的同时保证了标注质量的一致性。特别设计的三个任务赛道——单帧姿态估计、低数据泛化与姿态追踪,为算法评估提供了多维度的验证框架。
使用方法
研究者可通过官方提供的标准数据划分方案进行模型训练与验证。数据集支持三种典型应用场景:在单帧姿态估计任务中,可利用关键点标注数据训练检测网络;针对低数据泛化场景,可通过控制训练样本数量评估模型迁移能力;对于姿态追踪任务,则需结合连续帧间的关联标注开发时序推理算法。建议按照原始论文提供的基准方法进行性能对比,确保评估结果的可靠性。
背景与挑战
背景概述
动物姿态估计与追踪作为计算机视觉领域的重要分支,在生态行为分析、生物力学研究和野生动物监测中具有广泛应用。2023年,由杨宇翔、邓英琪等研究人员联合发布的APTv2数据集,突破了传统数据集的物种局限性,构建了涵盖30个物种、8.4万余个实例标注的大规模基准。该数据集通过2749段视频片段和4.1万帧图像,系统性地建立了跨物种姿态分析框架,为动物行为量化研究提供了标准化数据支撑,显著推动了视觉计算与生物学的交叉学科发展。
当前挑战
动物姿态估计领域长期面临物种形态多样性带来的关键点定位难题,不同动物的骨骼结构和运动模式差异导致通用模型泛化能力不足。在数据集构建过程中,研究者需应对野外环境下的复杂背景干扰、动物间遮挡问题以及高速运动造成的运动模糊。多目标追踪任务还需解决个体外观相似性引起的身份切换问题,而低数据泛化赛道则要求模型在有限标注样本下保持跨物种识别鲁棒性,这些挑战共同构成了动物视觉分析的技术瓶颈。
常用场景
经典使用场景
在计算机视觉领域,动物姿态估计与追踪技术正逐步成为生态学和行为学研究的重要工具。APTv2数据集凭借其涵盖30个物种、84,611个实例的大规模标注数据,为单帧姿态估计、低数据泛化以及姿态追踪等核心任务提供了标准化评估基准。研究者可通过该数据集系统验证模型在跨物种场景下的关键点检测精度与时空连续性分析能力,显著推动了动物运动分析的算法发展。
实际应用
在实践层面,APTv2支撑的算法已应用于野生动物保护监测系统,通过自动分析野外摄像数据实现物种行为模式识别。动物园智能化管理借助其姿态追踪能力评估动物福利状态,而畜牧产业则利用关键点检测技术优化养殖健康监测。这些应用不仅提升了生物观测效率,更通过量化运动特征为濒危物种保护策略制定提供了数据支撑。
衍生相关工作
基于APTv2的基准特性,学界涌现出多项创新工作。ViTAE-Transformer团队开发了跨物种姿态估计架构,解决了形态差异导致的特征提取难题;另有研究通过元学习框架提升低数据场景下的模型适应性。在追踪方向,结合时空图神经网络的方法显著改善了长序列姿态连续性,这些衍生成果共同构成了动物视觉分析领域的技术图谱。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作