CLEVR-XAI

github2024-05-24 更新2024-05-31 收录

下载链接：

https://github.com/ahmedmagdiosman/simply-clevr-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

CLEVR-XAI旨在为计算机视觉中的XAI解释（即热图）的定量评估提供基准数据集。它由视觉问答（VQA）问题组成，每个问题都附有几个真实掩码，可用作评估输入图像上热图的现实、选择性和受控测试平台。

CLEVR-XAI aims to provide a benchmark dataset for the quantitative evaluation of XAI (Explainable Artificial Intelligence) explanations (i.e., heatmaps) in computer vision. It consists of visual question answering (VQA) questions, each accompanied by several ground truth masks, which can be used as a realistic, selective, and controlled testbed for evaluating heatmaps on input images.

创建时间：

2020-03-14

原始信息汇总

CLEVR-XAI数据集概述

CLEVR-XAI 是一个用于定量评估计算机视觉中XAI解释（即热图）的基准数据集。该数据集包含以下两个子集：

CLEVR-XAI-simple: 包含39,761个简单问题，每个问题伴随以下两种地面实况（GT）：
- GT Single Object
- GT All Objects
CLEVR-XAI-complex: 包含100,000个复杂问题，每个问题伴随以下四种地面实况（GT）：
- GT Unique (适用于89,873个问题)
- GT Unique First-non-empty (适用于99,786个问题)
- GT Union (适用于99,786个问题)
- GT All Objects

数据集基于10,000张图像，每张图像平均对应约4个简单问题和10个复杂问题。

数据集内容

问题类型: 数据集中的问题来源于视觉问答（VQA）任务，简单问题通常涉及一个目标对象，而复杂问题可能涉及多个对象。
地面实况（GT）: 每个问题都配有相应的地面实况掩码，用于评估输入图像上的热图。

数据集使用

下载: 数据集可从releases部分下载。
生成: 提供了生成CLEVR-XAI数据集的代码，基于原始的CLEVR generator。

评估方法

在CLEVR-XAI数据集上测试了多种XAI方法，包括Layer-wise Relevance Propagation (LRP), Integrated Gradients, Guided Backprop, Guided Grad-CAM, SmoothGrad, VarGrad, Gradient, Gradient×Input, Deconvnet和Grad-CAM。

搜集汇总

数据集介绍

构建方式

CLEVR-XAI数据集的构建基于原始的CLEVR任务，通过生成视觉问答（VQA）问题，并为其配备多种真实掩码（GT masks）。具体而言，数据集包含39,761个简单问题和100,000个复杂问题，这些问题均基于10,000张图像。简单问题包含单个目标对象的掩码，而复杂问题则涉及多个对象的掩码，包括GT Unique、GT Unique First-non-empty和GT Union等类型。数据集的生成过程包括图像生成、问题生成和真实掩码生成，所有步骤均在Singularity容器中运行，确保了数据集的一致性和可重复性。

特点

CLEVR-XAI数据集的主要特点在于其为XAI解释（即热图）提供了量化评估的基准。数据集不仅包含丰富的视觉问答问题，还提供了多种真实掩码，这些掩码可以作为评估热图的现实、选择性和可控的测试平台。此外，数据集区分了简单和复杂问题，简单问题总是包含一个目标对象，而复杂问题则可能涉及多个对象，这种设计使得数据集在评估不同XAI方法时具有高度的灵活性和实用性。

使用方法

使用CLEVR-XAI数据集时，用户可以直接从GitHub的releases部分下载预生成版本，无需自行重新生成数据集。对于希望深入研究的用户，数据集提供了代码以生成CLEVR-XAI，包括图像生成、问题生成和真实掩码生成等步骤。此外，数据集还提供了用于生成热图的代码，这些热图基于Relation Network模型，该模型在原始CLEVR数据集上进行了训练。通过这些资源，用户可以全面评估和比较不同的XAI方法。

背景与挑战

背景概述

CLEVR-XAI数据集旨在为计算机视觉中可解释性人工智能（XAI）解释（即热图）的定量评估提供基准。该数据集基于原始CLEVR任务，包含视觉问答（VQA）问题，每个问题均附有多个真实掩码（GT masks），这些掩码可作为评估热图的现实、选择性和受控测试平台。CLEVR-XAI由Leila Arras、Ahmed Osman和Wojciech Samek等研究人员于2022年引入，其核心研究问题是如何在计算机视觉中有效评估XAI方法的解释质量。该数据集的发布对XAI领域具有重要影响，为研究人员提供了一个标准化的评估工具，促进了该领域的进一步发展。

当前挑战

CLEVR-XAI数据集在构建过程中面临多项挑战。首先，生成高质量的真实掩码需要精确的图像理解和复杂的算法支持，这增加了数据集构建的复杂性。其次，数据集包含39,761个简单问题和100,000个复杂问题，基于10,000张图像，确保每张图像的问题多样性和覆盖率是一个技术难题。此外，评估XAI方法的热图解释质量需要开发新的评估指标和方法，以确保评估的准确性和公正性。最后，数据集的生成和维护需要大量的计算资源和时间，这对研究团队的技术能力和资源管理提出了高要求。

常用场景

经典使用场景

在计算机视觉领域，CLEVR-XAI数据集的经典使用场景主要集中在可解释性人工智能（XAI）的量化评估。该数据集通过视觉问答（VQA）任务，提供了丰富的真实掩码（GT masks），这些掩码可以作为评估热图（heatmaps）在输入图像上的有效性的基准。研究者可以利用这些掩码来验证不同XAI方法的解释效果，如Layer-wise Relevance Propagation（LRP）、Integrated Gradients、Guided Backprop等，从而推动XAI技术的发展。

解决学术问题

CLEVR-XAI数据集解决了在XAI领域中缺乏标准化评估基准的问题。通过提供精确的地面真实掩码，该数据集使得研究者能够系统地比较不同解释方法的性能，从而推动XAI技术的进步。此外，CLEVR-XAI还为复杂视觉问答任务中的解释性研究提供了丰富的资源，有助于深入理解神经网络在处理视觉信息时的决策过程，对提升模型的透明度和可信度具有重要意义。

衍生相关工作

CLEVR-XAI数据集的发布激发了一系列相关研究工作，特别是在XAI方法的评估和改进方面。例如，研究者们基于CLEVR-XAI开发了新的评估指标和方法，以更精确地衡量解释性技术的有效性。此外，该数据集还促进了跨学科的合作，如计算机视觉与认知科学的结合，探索人类感知与机器解释之间的关联。这些衍生工作不仅丰富了XAI领域的理论基础，也为实际应用提供了更多可能性。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集