Zero Shot Detection Dataset
收藏github2023-10-13 更新2024-05-31 收录
下载链接:
https://github.com/pengkaizhu/zsd_dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于零样本检测,包含Pascal VOC和MSCOCO数据集的分割,用于训练和测试零样本学习模型。数据集根据指定的可见类别名称进行分割,并提供了用于论文中的分割和属性文件。
This dataset is designed for zero-shot detection, encompassing segmentations from the Pascal VOC and MSCOCO datasets, utilized for training and testing zero-shot learning models. The dataset is segmented according to specified visible category names and provides segmentation and attribute files for use in academic papers.
创建时间:
2018-05-16
原始信息汇总
Zero Shot Detection Dataset 概述
数据集来源与用途
- 来源: 用于论文《Zero Shot Detection》,作者为 Pengkai Zhu, Hanxiao Wang, Tolga Bolukbasi 和 Venkatesh Saligrama。
- 用途: 支持零样本检测研究。
数据集结构
- 数据分割: 数据集从 Pascal VOC 和 MSCOCO 中分割,分为四个部分:
- Train: 训练集中的已知类别。
- Test-Seen: 验证/测试集中的已知类别。
- Test-Unseen: 训练、验证、测试集中的未知类别。
- Test-Mix: 验证/测试集中的已知和未知类别混合。
属性文件
- Pascal VOC: 自动下载并提取属性文件。
- MSCOCO: 提供以下属性文件:
coco_w2v.txt: MSCOCO 类别的 w2v 属性。coco_w2v_voc.txt: MSCOCO 类别的 w2v 属性(映射 VOC 属性相似性)。voc.txt: VOC 类别的标记属性(来自 aP&Y)。voc_w2v.txt: VOC 类别的 w2v 属性。
使用方法
-
Pascal VOC 设置: bash bash get_voc_zsd_dataset.sh $zsd-data-dir # 下载并保存到指定目录
或自定义分割: bash python zsd_split.py --dataset voc --data_dir $zsd-data-dir --name_file voc.names --seen_name_file seen_names/voc/${choose another split} --save_dir ${split save name}
-
MSCOCO 设置: bash bash get_coco_zsd_dataset.sh $zsd-data-dir # 下载并保存到指定目录
搜集汇总
数据集介绍

构建方式
Zero Shot Detection Dataset的构建基于Pascal VOC和MSCOCO两大经典视觉数据集,通过特定的脚本将数据集划分为四个部分:训练集(Train)、测试集-可见类(Test-Seen)、测试集-未见类(Test-Unseen)以及测试集-混合类(Test-Mix)。划分依据为预先定义的可见类别名称,确保数据集的多样性和挑战性。此外,数据集中还包含了从aP&Y和Word2Vec中提取的属性信息,进一步丰富了数据的语义表示。
特点
该数据集的特点在于其专注于零样本检测任务,通过引入未见类别的数据,模拟了现实世界中模型面对未知类别时的检测能力。数据集不仅提供了丰富的视觉数据,还包含了语义属性信息,如Word2Vec向量和标注属性,这些信息为模型提供了额外的语义线索,有助于提升零样本检测的性能。数据集的划分方式也极具创新性,能够有效评估模型在多种场景下的泛化能力。
使用方法
使用Zero Shot Detection Dataset时,用户需首先安装`numpy`库,并通过提供的脚本下载和预处理Pascal VOC或MSCOCO数据集。用户可以通过运行`get_voc_zsd_dataset.sh`或`get_coco_zsd_dataset.sh`脚本,将数据集下载到指定目录,并自动生成划分后的子集。若用户已下载数据集或希望使用其他划分方式,可通过`zsd_split.py`脚本自定义数据集划分。数据集的属性文件位于`attributes`子文件夹中,用户可根据需要选择使用。
背景与挑战
背景概述
Zero Shot Detection Dataset 是由 Pengkai Zhu、Hanxiao Wang、Tolga Bolukbasi 和 Venkatesh Saligrama 等研究人员于2019年创建的,旨在解决零样本检测(Zero Shot Detection, ZSD)问题。该数据集基于 Pascal VOC 和 MSCOCO 两大经典计算机视觉数据集,通过特定的类别划分方法,将数据分为训练集、测试集(包含已见类别和未见类别)以及混合类别测试集。零样本检测的核心研究问题在于如何使模型能够识别在训练过程中从未见过的类别,这一挑战推动了计算机视觉领域在跨类别泛化能力上的深入研究。该数据集的发布为相关领域的研究提供了重要的基准,促进了零样本学习技术的发展。
当前挑战
Zero Shot Detection Dataset 的构建和应用面临多重挑战。首先,零样本检测的核心问题在于如何在没有直接监督信号的情况下,使模型能够准确识别未见类别的对象。这要求模型具备强大的语义理解和跨类别泛化能力,而现有的深度学习模型在这一任务上表现仍不理想。其次,数据集的构建过程中,如何合理划分已见和未见类别是一个关键挑战。类别划分的合理性直接影响模型的训练效果和泛化能力,而不同划分方式可能导致结果差异显著。此外,数据集中类别的语义属性提取和表示也是一个复杂问题,如何有效利用外部知识(如词向量)来增强模型的语义理解能力,仍需进一步探索。
常用场景
经典使用场景
Zero Shot Detection Dataset 主要用于零样本检测(Zero Shot Detection, ZSD)领域的研究,特别是在计算机视觉中的目标检测任务中。该数据集通过对Pascal VOC和MSCOCO数据集进行特定的划分,生成了训练集、测试集(包含已见和未见类别)以及混合测试集,为研究者提供了一个标准化的实验平台。通过这种方式,研究者可以评估模型在未见类别上的泛化能力,从而推动零样本检测技术的发展。
衍生相关工作
基于Zero Shot Detection Dataset,许多经典的研究工作得以展开。例如,Pengkai Zhu等人提出的零样本检测框架为后续研究奠定了基础,许多改进算法如基于属性嵌入的方法和生成对抗网络(GAN)的应用也在该数据集上进行了验证。此外,该数据集还催生了一系列关于跨模态学习和多任务学习的研究,进一步拓展了零样本检测的应用范围。
数据集最近研究
最新研究方向
在计算机视觉领域,零样本检测(Zero Shot Detection, ZSD)作为一种新兴的研究方向,旨在解决模型在未见过的类别上进行检测的挑战。Zero Shot Detection Dataset为此提供了重要的实验平台,结合Pascal VOC和MSCOCO数据集,通过特定的类别划分和属性标注,支持模型在训练过程中从未见过的类别上进行有效检测。近年来,研究者们利用该数据集探索了多种深度学习模型和迁移学习策略,特别是在跨领域知识迁移和语义属性嵌入方面取得了显著进展。这些研究不仅推动了零样本检测技术的发展,也为实际应用中的目标检测任务提供了新的解决方案。
以上内容由遇见数据集搜集并总结生成



