Large-scale Attribute Dataset (LAD)

Name: Large-scale Attribute Dataset (LAD)
Creator: 视频技术国家工程实验室，机器感知教育部重点实验室，协同媒体创新中心，北京大学，北京
Published: 2018-05-16 12:13:44
License: 暂无描述

arXiv2018-05-16 更新2024-06-21 收录

下载链接：

https://github.com/PatrickZH/A-Large-scaleAttribute-Dataset-for-Zero-shot-Learning

下载链接

链接失效反馈

官方服务：

资源简介：

Large-scale Attribute Dataset (LAD)是由北京大学等机构的研究人员创建的大型属性数据集，包含78,017张图像，覆盖230个类别，分为5个超类（领域）。数据集通过使用流行的搜索引擎搜集图像，并经过严格的预处理和标注，确保图像质量和属性准确性。LAD数据集定义了359个视觉、语义和主观属性，旨在为零样本学习提供一个更全面、多样化的测试平台，以解决现有数据集在图像分布和属性多样性方面的缺陷，并克服由对象共现偏差引起的问题。

The Large-scale Attribute Dataset (LAD) is a curated large-scale attribute dataset developed by researchers from Peking University and other affiliated institutions. It comprises 78,017 images spanning 230 distinct categories, which are grouped into 5 supercategories (domains). The dataset is compiled by collecting images through mainstream search engines, followed by rigorous preprocessing and annotation workflows to ensure both image quality and the accuracy of attribute annotations. LAD defines 359 visual, semantic, and subjective attributes, and is intended to serve as a more comprehensive and diverse testbed for zero-shot learning, addressing the limitations of existing datasets in terms of image distribution and attribute diversity, as well as alleviating issues induced by object co-occurrence bias.

提供机构：

视频技术国家工程实验室，机器感知教育部重点实验室，协同媒体创新中心，北京大学，北京

创建时间：

2018-04-12

搜集汇总

数据集介绍

构建方式

LAD数据集的构建分为四个步骤：定义类别和属性、图像抓取、数据预处理和数据标注。首先，定义了动物、水果、车辆、电子设备和发型五个领域的类别，并为每个领域设计了属性列表。其次，通过使用百度和谷歌等搜索引擎抓取每个类别的图像。然后，对抓取的图像进行预处理，包括去除低质量图像、重复图像和无关噪声图像，并去除包含多个前景对象的图像以减少共现偏差。最后，对每个类别的随机选择的20张图像进行实例级属性标注，并计算类别级属性。

使用方法

LAD数据集可以用于评估零样本学习方法，包括零样本识别和零样本生成。对于零样本识别，可以将数据集分为训练集和测试集，使用预训练的ResNet特征提取器提取图像特征，并使用不同的零样本学习方法进行预测。对于零样本生成，可以使用条件生成对抗网络（Conditional GAN）等生成模型，根据属性生成未见类别的图像。在使用LAD数据集时，需要注意数据分割方式和类别选择，以确保评估结果的可靠性。

背景与挑战

背景概述

在近年来备受关注的零样本学习（Zero-Shot Learning, ZSL）领域中，研究人员致力于学习未曾见过的全新概念。传统的ZSL算法通过引入属性作为中间语义表示，实现从已知类别到未知类别的知识迁移。然而，现有的属性数据集在图像分布和属性多样性方面存在缺陷，并且存在“共现偏差问题”，即由于对象共现的偏差，显著阻碍了模型正确学习概念。为了克服这些问题，Bo Zhao等人提出了一个大规模属性数据集（Large-scale Attribute Dataset, LAD）。LAD包含来自5个超级类别（领域）的230个类别的78,017张图像。该数据集在图像数量和属性数量方面均超过了目前最流行的四个属性数据集。此外，LAD还定义和标注了359个视觉、语义和主观属性的实例级标注。通过对该数据集进行监督学习和零样本学习任务的分析，研究人员展示了其在ZSL算法评估中的重要作用。LAD已成为AI Challenger中零样本学习竞赛的基准数据集。

当前挑战

LAD数据集面临的挑战主要表现在两个方面：1) 所解决的领域问题：LAD旨在解决零样本学习中的共现偏差问题，通过收集只包含单个前景对象的图像，减少由于对象共现导致的偏差。2) 构建过程中所遇到的挑战：构建LAD数据集需要收集大量不同类别和属性的图像，并进行实例级的属性标注，这需要大量的人力和时间投入。此外，LAD数据集中包含了丰富的视觉、语义和主观属性，如何有效地利用这些属性进行零样本学习，也是一个重要的挑战。

常用场景

经典使用场景

在零样本学习（Zero-Shot Learning, ZSL）领域，LAD 数据集是一个经典的使用场景。该数据集包含了大量图像及其对应的属性标注，这使得研究人员可以训练模型来识别未见过的类别。在 ZSL 任务中，模型需要从已知的类别中学习知识，并将其迁移到未知的类别上。LAD 数据集的多样性和规模使得模型可以更好地学习到泛化的知识，从而在未见过的类别上进行有效的识别。

解决学术问题

LAD 数据集解决了 ZSL 任务中存在的几个关键问题。首先，它提供了一个大规模的、多样化的数据集，这使得模型可以学习到更丰富的知识，从而提高在未知类别上的识别准确率。其次，LAD 数据集通过减少类别和图像的重叠，避免了“共现偏差”问题，这使得模型可以更准确地学习到每个类别的特征。最后，LAD 数据集包含了视觉、语义和主观属性等多种属性标注，这使得模型可以从多个角度学习到类别的特征，从而提高识别准确率。

实际应用

LAD 数据集在实际应用中具有重要的价值。它可以帮助研究人员开发更先进的 ZSL 模型，从而在现实世界中识别未见过的类别。例如，在野生动物保护领域，可以使用 LAD 数据集训练模型来识别新发现的物种。在医疗领域，可以使用 LAD 数据集训练模型来识别新的疾病。此外，LAD 数据集还可以用于开发更智能的图像搜索系统，从而帮助用户找到更相关的图像。

数据集最近研究