HiFSOD-Bird
收藏arXiv2022-10-08 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2210.03940v1
下载链接
链接失效反馈官方服务:
资源简介:
HiFSOD-Bird是由复旦大学等机构创建的大型高质量数据集,包含176,350张野生鸟类图像,分为1,432个类别,涵盖全球90%以上的水鸟及部分森林鸟类。该数据集采用4级分类体系,包括32个目、132个科、572个属和1,432个种。所有图像均经过专业标注,每个类别附有文本描述,适用于零样本学习。此数据集对监测和保护濒危鸟类具有重要意义,同时为解决细粒度分类问题提供了有力支持。
HiFSOD-Bird is a large-scale high-quality dataset created by Fudan University and other institutions. It comprises 176,350 wild bird images categorized into 1,432 classes, covering over 90% of the world's water birds and some forest bird species. This dataset adopts a four-level classification framework consisting of 32 orders, 132 families, 572 genera, and 1,432 species. All images have been professionally annotated, and each category is equipped with textual descriptions, making it applicable for zero-shot learning. This dataset holds great significance for the monitoring and conservation of endangered birds, while providing robust support for addressing fine-grained classification tasks.
提供机构:
复旦大学
创建时间:
2022-10-08
搜集汇总
数据集介绍

构建方式
HiFSOD-Bird数据集的构建始于从多个非版权网站上收集野生鸟类图像,并经过标准清洗程序去除低质量及重复图像。随后,招募专业标注人员进行图像的边界框和标签标注,并进行交叉检查以确保标注质量。为确保数据集的适用性,对于图像数量不足11张的类别,予以剔除。最终,数据集包含176,350张高质量的鸟类图像,共1,432个类别,组织成4级层次分类:目、科、属和种。此外,为支持零样本目标检测任务,还从维基百科获取了每个鸟类类别的文本描述。
特点
HiFSOD-Bird数据集的特点在于其层次化且细粒度的类别空间,以及图像数量的长尾分布。所有类别均按照层次分类法组织,随着层次的深入,类别之间的差异逐渐减小,分类难度也随之增加。长尾分布反映了鸟类在自然界中的真实分布情况,其中一些鸟类种类繁多,样本容易获得,而大多数鸟类种类较少,样本难以获取,甚至有些鸟类罕见且濒临灭绝,样本获取难度极大。
使用方法
HiFSOD-Bird数据集可用于训练和测试基于层次化小样本目标检测(Hi-FSOD)的方法。使用该数据集时,首先将鸟类图像分为基础类和新型类,通常在目级别进行划分。然后,在每个类别中进行图像采样,以满足10次实验的要求。所有标注文件均采用COCO格式,以便于使用。在训练过程中,可使用层次对比学习和概率损失来增强模型的泛化能力,并纠正分类错误。
背景与挑战
背景概述
随着计算机视觉技术的不断发展,目标检测在许多领域得到了广泛应用。然而,传统的目标检测方法需要大量的标注数据进行训练,这在实际应用中往往难以获取。针对这一问题,少样本目标检测(FSOD)应运而生,旨在通过少量样本进行目标检测。然而,现实世界中的许多目标类别呈现出层次化的细粒度分类结构,例如动物可以根据分类学划分为目、科、属和种等。现有的FSOD方法并未考虑这种层次化结构,无法有效处理此类场景。为了解决这一问题,研究人员提出了一个新的问题:层次化少样本目标检测(Hi-FSOD),旨在在层次化分类体系下进行少样本目标检测。Hi-FSOD相较于FSOD更具挑战性,且应用范围更广。
当前挑战
Hi-FSOD数据集的构建过程中,研究人员面临的主要挑战包括:1)如何构建一个大规模、高质量的Hi-FSOD基准数据集,以支持Hi-FSOD问题的研究;2)如何设计有效的Hi-FSOD方法,以提高模型的泛化能力。为了应对这些挑战,研究人员构建了首个高质量的Hi-FSOD基准数据集HiFSOD-Bird,并提出了首个Hi-FSOD方法HiCLPL。HiCLPL采用层次化对比学习来约束特征空间,使得物体特征分布与层次化分类体系保持一致,并通过概率损失来纠正分类体系中非叶节点的分类错误。实验结果表明,HiCLPL在HiFSOD-Bird数据集上取得了优异的性能,证明了其在层次化少样本目标检测任务中的有效性和优越性。
常用场景
经典使用场景
HiFSOD-Bird数据集在解决具有层次细粒度类别结构的对象检测问题中扮演了关键角色。其经典使用场景包括在现实世界中对动物、植物等具有层次分类结构的对象进行检测。例如,在野生动物保护中,利用HiFSOD-Bird数据集可以实现对不同种类鸟类的识别与定位,从而有助于监测和保护濒危鸟类。
解决学术问题
HiFSOD-Bird数据集解决了传统少样本目标检测方法无法处理具有层次分类结构对象的问题。该数据集包含了具有层次分类结构的鸟类图片,为研究层次少样本目标检测提供了重要的数据基础。通过构建HiFSOD-Bird数据集,研究人员可以评估和比较不同层次少样本目标检测方法的性能,推动该领域的研究发展。
衍生相关工作
HiFSOD-Bird数据集的提出和构建,衍生了多个相关研究工作。例如,HiCLPL方法是一种基于层次对比学习和概率损失的层次少样本目标检测方法,该方法在HiFSOD-Bird数据集上取得了优异的性能。此外,还有其他研究工作,如层次分类、细粒度图像识别等,也受到了HiFSOD-Bird数据集的启发,推动了相关领域的研究进展。
以上内容由遇见数据集搜集并总结生成



