CUB-200, mini-ImageNet, DTD, Flowers-102, CIFAR-100
收藏数据集概述
数据集描述
该数据集用于Active Class-Incremental Learning (ACIL)研究,旨在从大规模未标注数据池中选择最具信息量的样本,以有效训练增量学习器。数据集包括以下几个部分:
- CUB-200
- mini-ImageNet
- DTD
- Flowers-102
- CIFAR-100(自动下载)
数据集下载
数据集文件已上传至Google Drive,用户可以下载并解压使用。
数据集使用
建议使用软链接部署数据集。用户可以将下载的数据集解压到任意目录,然后从LP-DiF的根目录创建符号链接。
bash cd CBS_LP-DiF mkdir data cd data ln -s /path/to/cub200 ./CUB_200_2011 ln -s /path/to/miniImageNet ./miniimagenet ln -s /path/to/dtd ./dtd ln -s /path/to/Flowers102 ./Flowers102 cd ..
数据集训练
用户可以通过运行提供的脚本来训练模型。例如:
-
在DTD数据集上运行CBS + 未标注数据,设置
B=100(相当于5轮): bash bash start_scripts/acil_scripts/start_dtd_wo_base_our_acil_distribution_kmeans_random_discard_greedy_add_pseudo.sh 5 -
在Flowers102数据集上运行CBS,设置
B=20(相当于1轮): bash bash start_scripts/acil_scripts/start_flowers_wo_base_our_acil_distribution_kmeans_random_discard_greedy.sh 1
在start_scripts/acil_scripts目录下,用户可以找到更多针对不同数据集和不同主动学习方法的启动脚本。




