OpenCIL
收藏OpenCIL 数据集概述
数据集描述
OpenCIL 是一个专门为类增量学习(CIL)模型中的事后和微调基于的分布外(OOD)检测方法设计的基准平台。它评估了 CIL 模型在拒绝各种 OOD 样本方面的能力。OpenCIL 提供了一个灵活的算法模板,允许用户轻松地在平台上实现他们独特的设计。此外,它提供了一个新的评估协议,以公平和系统地比较不同增量步骤中的各种 OOD 检测方法,并全面评估由 15 个 OOD 检测器和 4 个 CIL 模型组成的 60 个基线。我们还提出了一种新的基线方法 BER,可以有效缓解 60 个基线中的常见问题。
数据集下载和准备
数据集可以从以下链接下载:GDrive。下载后,将其解压到具有以下结构的 data 文件夹中:
├── data │ └── benchmark_imglist │ ├── cifar100 │ ├── imagenet │ └── images_classic │ ├── cifar10 │ ├── cifar100 │ ├── mnist │ ├── places365 │ ├── svhn │ ├── texture │ ├── tin │ └── images_largescale │ ├── imagenet_1k │ ├── train │ ├── val │ ├── imagenet_o │ ├── inaturalist │ ├── openimage_o │ ├── species_sub
注意:train.zip 和 val.zip 应存储在 imagenet_1k 文件夹中。
数据集解释
1. 用于训练类增量学习模型的 ID 数据集
训练类增量学习模型使用两个主要数据集:小规模数据集 cifar100 和大规模数据集 imagenet1k。训练此类模型需要将原始数据集拆分为多个任务,每个任务的数据样本形成与其他任务数据样本不相交的集合。
-
cifar100: 总共 100 个类别,有三种主要设置:
- 5 个任务:每个任务 20 个类别
- 10 个任务:每个任务 10 个类别
- 20 个任务:每个任务 5 个类别
- 每个任务的 exemplar 大小:2,000
-
imagenet1k: 总共 1000 个类别,有三种主要设置:
- 5 个任务:每个任务 200 个类别
- 10 个任务:每个任务 100 个类别
- 20 个任务:每个任务 500 个类别
- 每个任务的 exemplar 大小:20,000
2. 用于训练微调基于的 OOD 检测方法的数据集(可选)
在训练类增量学习模型后,我们可以冻结 CIL 模型的特征提取器,并微调一个额外的分类器以拒绝 OOD 样本,同时保持增量分类准确性。
3. 用于测试预训练或微调 CIL 模型的 OOD 数据集
在训练或微调类增量学习模型后,我们应使用其他 OOD 数据集测试其 OOD 检测性能。
-
小规模数据集: 在 cifar100 上训练 CIL 模型(100 个类别),然后在以下 OOD 数据集上进行测试:
- nearood: cifar10, tin
- farood: mnist, svhn, texture, places365
-
大规模数据集: 在 imagenet1k 上训练 CIL 模型(1000 个类别),然后在以下 OOD 数据集上进行测试:
- nearood: species, inaturalist, openimage_o, imagenet_o
- farood: texture, mnist

- 1OpenCIL: Benchmarking Out-of-Distribution Detection in Class-Incremental Learning北京航空航天大学,新加坡管理大学,北京航空航天大学江西研究院 · 2024年



