Flowers-620
收藏arXiv2016-04-11 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1512.05227v2
下载链接
链接失效反馈官方服务:
资源简介:
Flowers-620数据集是由Cornell University和NEC Labs America合作创建的细粒度花卉分类数据集,包含620种花卉的20,211张图像。该数据集通过深度度量学习和人类参与的迭代框架进行数据集引导,旨在解决细粒度视觉分类中的训练数据缺乏、类别众多和类内高变异与类间低变异的问题。数据集的创建过程中,利用模型生成的置信度高的图像进行人工标注,筛选出真实正例和困难负例,不断扩充和优化数据集。Flowers-620数据集主要应用于细粒度花卉分类研究,通过该数据集的引导,能够提升模型的分类性能,达到当前最先进的技术水平。
The Flowers-620 dataset is a fine-grained flower classification dataset co-developed by Cornell University and NEC Labs America, comprising 20,211 images spanning 620 flower species. This dataset is built upon a dataset-guided framework that integrates deep metric learning and human-in-the-loop iteration, with the goal of addressing core challenges in fine-grained visual classification: insufficient training data, large-scale category sets, high intra-class variability, and low inter-class variability. During its construction process, manually annotated high-confidence images generated by models were used to screen true positive samples and hard negative samples, enabling continuous expansion and optimization of the dataset. The Flowers-620 dataset is primarily utilized for fine-grained flower classification research. Leveraging this dataset for model guidance can effectively improve classification performance, achieving the current state-of-the-art level.
提供机构:
美国国家航空航天局
创建时间:
2015-12-17
搜集汇总
数据集介绍

构建方式
在细粒度视觉分类领域,数据稀缺与标注成本高昂是长期存在的挑战。Flowers-620数据集的构建采用了一种创新的迭代式人机协同框架,旨在高效扩展训练数据。该框架首先通过Instagram API收集了约两百万张带有“flower”标签的图像,并利用预训练的GoogLeNet-Inception模型进行初步过滤,保留置信度高于0.5的图像作为候选集。随后,通过深度度量学习模型对候选图像进行细粒度分类,仅将高置信度的图像提交给人类标注者进行二元判断(真阳性或假阳性)。真阳性图像被纳入数据集,而假阳性则作为硬负样本用于模型的重训练。这一过程循环迭代,最终从Instagram图像中自举出包含620个花卉类别、共计20,211张图像的数据集,有效缓解了数据匮乏问题。
特点
Flowers-620数据集在细粒度花卉分类研究中展现出显著特点。其涵盖620个花卉物种,规模远超传统细粒度数据集,为模型训练提供了丰富的类别多样性。数据源自社交媒体平台,图像具有自然场景下的复杂背景、多变光照和姿态,更贴近实际应用环境。通过人机协同的标注机制,数据集不仅包含高质量的真阳性样本,还积累了大量的硬负样本,这些样本在视觉上与目标类别高度相似,为度量学习提供了宝贵的挑战性示例。数据集的构建过程深度融合了深度度量学习与人类专家知识,确保了标注的准确性与数据的代表性。
使用方法
Flowers-620数据集主要用于推动细粒度视觉分类算法的研究与发展。研究者可将其作为训练与测试基准,评估深度度量学习、特征嵌入及分类模型的性能。使用该数据集时,通常遵循标准的数据划分方案,将15,437张图像用于训练,其余用于测试。基于数据集的特性,建议采用端到端的深度度量学习方法,如三元组网络,以利用其提供的硬负样本学习更具判别力的低维特征嵌入。在训练过程中,可借鉴论文中的局部正样本采样和硬负样本挖掘策略,以捕捉类内方差并增强类间区分度。此外,该数据集也适用于研究数据自举、半监督学习及人机协同标注等前沿方向。
背景与挑战
背景概述
在细粒度视觉分类领域,数据稀缺与类别间高度相似性构成了核心研究瓶颈。Flowers-620数据集由康奈尔大学与NEC实验室的研究团队于2016年共同创建,旨在通过迭代式数据增强框架解决细粒度花卉分类中的三大挑战:训练样本不足、类别数量庞大以及类内差异高而类间差异低的问题。该数据集从Instagram平台爬取图像,并融合深度度量学习与人工标注循环,最终构建了包含620个花卉类别、逾两万张图像的大规模资源。其创新性体现在将人类专家知识嵌入模型训练流程,不仅扩充了数据规模,还通过引入困难负样本优化了特征嵌入空间,为细粒度识别研究提供了新的方法论范式,显著推动了该领域在自然场景下的应用进展。
当前挑战
Flowers-620数据集所应对的领域挑战集中于细粒度花卉分类任务,其核心难点在于区分视觉特征高度相似的子类别,例如不同品种的花卉在形状、颜色上差异微妙,而同一品种却可能因拍摄角度、光照条件呈现较大类内变化。构建过程中的挑战则体现在数据采集与标注环节:首先,从社交媒体获取的图像存在背景复杂、标签噪声等问题,需通过预训练模型进行高效过滤;其次,针对数百个专业类别,标注工作依赖领域知识,传统多分类标注效率低下。为此,研究团队设计了二元决策标注流程,降低人工认知负荷,并利用困难负样本反馈至度量学习模型,形成人机协同的迭代优化机制,但这一过程仍面临标注成本高、模型训练周期长的实际约束。
常用场景
经典使用场景
在细粒度视觉分类领域,Flowers-620数据集常被用于评估和开发先进的深度学习模型,特别是针对高类内差异和低类间差异的挑战性场景。该数据集包含620种花卉类别,共计20,211张图像,源自Instagram的自然图像,其多样性和真实性为模型提供了丰富的训练和测试环境。研究者通常利用该数据集验证基于度量学习的框架,通过三元组损失和局部正样本采样策略,学习低维特征嵌入以捕捉类别内部的细微变化,同时保持类别间的判别性。这一经典应用场景推动了细粒度分类方法在复杂自然图像上的性能提升。
衍生相关工作
Flowers-620数据集衍生了一系列经典研究工作,主要集中在细粒度分类和度量学习的交叉领域。例如,基于该数据集提出的三元组网络与锚点学习结合的方法,启发了后续如FaceNet等模型在面部识别中的应用。同时,其迭代式数据集引导框架被扩展到其他细粒度数据集如CUB-200-2011鸟类数据集,推动了B-CNN等双线性卷积网络的发展。这些工作不仅验证了深度度量学习在捕获类内方差方面的有效性,还为构建大规模细粒度视觉系统提供了方法论基础,促进了整个领域的进步。
数据集最近研究
最新研究方向
在细粒度视觉分类领域,Flowers-620数据集的最新研究方向聚焦于结合深度度量学习与人机协同的迭代式数据集自举框架。该框架通过构建低维特征嵌入,利用流形上的锚点捕捉类内方差,同时保持类间区分性,有效应对了训练数据稀缺、类别众多以及类内方差高而类间方差低的挑战。前沿探索中,研究者们进一步优化了在线硬负样本挖掘策略,并引入局部正样本采样机制以学习更具表达力的流形结构,从而在花卉物种识别等任务中实现了显著的性能提升。这一方向不仅推动了细粒度分类模型的精度边界,还为大规模自然图像数据集的自动化构建与标注提供了可扩展的范式,对计算机视觉领域的实际应用具有深远影响。
相关研究论文
- 1Fine-grained Categorization and Dataset Bootstrapping using Deep Metric Learning with Humans in the Loop美国国家航空航天局 · 2016年
以上内容由遇见数据集搜集并总结生成



