five

PetFace|动物面部识别数据集|动物监测与识别数据集

收藏
arXiv2024-07-18 更新2024-07-22 收录
动物面部识别
动物监测与识别
下载链接:
https://dahlian00.github.io/PetFacePage/
下载链接
链接失效反馈
资源简介:
PetFace数据集由京都大学和日本东京大学联合创建,是一个大规模的动物面部识别数据集,包含257,484个独特的个体,跨越13个动物家族和319个品种类别。数据集包含1,012,934张图像,通过互联网自动和手动过滤过程收集,确保数据集不仅规模大,而且细节丰富且清洁。数据集提供了包括性别、品种、颜色和图案在内的细粒度注释,支持对已知和未知个体的识别。PetFace数据集的应用领域包括动物行为监测、栖息地调查和失踪动物寻找,旨在推动非侵入性动物自动识别方法的发展。
提供机构:
京都大学,日本东京大学
创建时间:
2024-07-18
原始信息汇总

PetFace 数据集概述

数据集简介

PetFace 是一个大规模的动物识别数据集和基准,包含 257,484 个独特的个体,涵盖 13 个动物家族和 319 个品种。该数据集不仅包括实验动物,还包括宠物动物,旨在推动动物面部识别技术的发展。

数据集特点

  • 大规模个体:包含 257,484 个独特的动物个体。
  • 多样性:涵盖 13 个动物家族和 319 个品种。
  • 详细标注:包括性别、品种、颜色和图案等精细标注。
  • 性能优越:模型在 PetFace 数据集上的表现优于其他数据集,尤其是在品种细节和未见过的动物家族识别上。

数据集分布

  • 个体数量:每个动物家族的个体数量分布。
  • 性别分布:每个动物家族的性别分布百分比。
  • 品种示例:品种标注的示例。
  • 颜色示例:颜色标注的示例。

基准测试结果

  • 动物重识别:ArcFace 损失函数表现最佳,联合训练的模型在 PetFace 上显示出最高的平均 top-1 准确率。
  • 动物验证:联合训练的模型在 PetFace 上表现最佳,与其他数据集上训练的模型相比也显示出优势。

数据集链接

该数据集仅供研究使用。请填写 Google Form 以确认使用目的,我们将尽快发送数据集链接。

BibTeX 引用

bibtex @misc{shinoda2024petface, title={PetFace: A Large-Scale Dataset and Benchmark for Animal Identification}, author={Risa Shinoda and Kaede Shiohara}, year={2024}, eprint={2407.13555}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2407.13555}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
PetFace数据集的构建采用了大规模的互联网图像采集方法,涵盖了13个动物家族和319个品种,共计257,484个独特的个体。通过自动化和人工筛选过程,确保了数据集的高质量和细粒度分类。图像来源包括宠物商店和动物收养网站,这些来源提供了高质量、多样化的图像,捕捉了动物从不同角度和环境下的外观特征。此外,数据集还包括了性别、品种、颜色和图案等细粒度注释,以支持更精细的识别和评估任务。
特点
PetFace数据集的主要特点在于其大规模和多样性,包含了超过25万个体和13个动物家族的详细注释。这种多样性使得数据集能够支持对未见个体的验证任务,填补了现有数据集在这方面的不足。此外,数据集的细粒度注释,如性别、品种、颜色和图案,为下游应用提供了丰富的信息,增强了数据集在实际场景中的适用性。
使用方法
PetFace数据集可用于训练和评估动物面部识别模型,特别适用于重新识别已知个体和验证未见个体。数据集提供了两种主要的评估协议:已知个体的重新识别和未见个体的验证。研究人员可以使用这些协议来测试和改进模型的泛化能力。此外,数据集的细粒度注释可以用于开发更复杂的识别算法,以应对不同品种和颜色的动物识别挑战。
背景与挑战
背景概述
在动物行为监测、调查以及寻找丢失动物等应用中,自动化动物面部识别技术发挥着至关重要的作用。尽管人类面部识别技术取得了显著进展,但由于缺乏适用于动物领域的数据集和基准,该领域的研究进展受到了阻碍。为此,Risa Shinoda和Kaede Shiohara于2024年推出了PetFace数据集,这是一个大规模的动物面部识别资源,涵盖了13个动物家族和319个品种类别,共计257,484个独特的个体。该数据集不仅规模庞大,还包含了性别、品种、颜色和图案等细粒度注释,为研究未见过的动物面部验证提供了有力支持。PetFace数据集的推出,标志着动物面部识别领域的一个重要里程碑,有望推动非侵入式动物自动识别技术的发展。
当前挑战
PetFace数据集在构建过程中面临了多个挑战。首先,动物面部识别领域的数据集相对匮乏,现有的公开数据集通常包含的个体数量不足100个,这限制了模型的泛化能力和对未见个体的精确评估。其次,收集和注释大规模动物面部图像的过程复杂且耗时,需要自动化和手动过滤相结合,以确保数据集的质量和细粒度分类的准确性。此外,动物面部结构的多样性和复杂性,以及不同动物家族和品种之间的显著差异,增加了模型训练和验证的难度。PetFace数据集的成功构建和应用,为解决这些挑战提供了新的思路和方法,但仍需进一步研究和优化以提升识别性能。
常用场景
经典使用场景
PetFace数据集在动物面部识别领域具有广泛的应用前景,尤其在动物行为监测、生态调查和失踪动物寻找等方面。其大规模的个体覆盖和精细的注释信息,使得该数据集成为研究未见个体面部验证的理想资源。通过提供已知和未知个体的重新识别基准,PetFace数据集推动了动物面部识别技术的进步。
衍生相关工作
PetFace数据集的发布催生了一系列相关研究工作,特别是在动物面部识别和重新识别领域。例如,基于PetFace数据集的模型训练和评估,研究人员开发了多种先进的面部识别算法,这些算法在识别准确性和泛化能力上表现优异。此外,PetFace数据集还激发了对多物种集成识别技术的研究,推动了动物面部识别技术的跨物种应用和发展。
数据集最近研究
最新研究方向
在动物识别领域,PetFace数据集的引入标志着对自动化动物面部识别技术的重要推动。该数据集不仅规模庞大,涵盖了257,484个独特个体,跨越13个动物家族和319个品种,还包含了详细的细粒度标注,如性别、品种、颜色和图案。这些特性使得PetFace成为研究未见个体面部验证的理想平台,这一领域在现有数据集中由于个体数量有限而未得到充分探索。此外,PetFace提供的基准测试,包括已知个体的重识别和未知个体的验证,显著提升了模型在处理细粒度品种变化和未见动物家族时的表现。这些研究不仅推动了动物面部识别技术的发展,还促进了非侵入式动物自动识别方法的进步,具有重要的应用价值和科学意义。
相关研究论文
  • 1
    PetFace: A Large-Scale Dataset and Benchmark for Animal Identification京都大学,日本东京大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录