Genview_syntheric_dataset_in1k
收藏GenView ImageNet Dataset
数据集描述
GenView ImageNet Dataset 是为自监督学习设计的,专注于通过自适应视图生成来增强视图质量。它使用预训练的 CLIP ViT-H/14 主干网络,通过PCA分析分离前景和背景,生成语义一致的图像变体。噪声水平根据前景比例进行调整,确保多样性和语义一致性。
数据集来源
- Repository: ImageNet
- Paper: ImageNet: A Large-Scale Hierarchical Image Database
使用方法
下载数据集
GenView ImageNet Dataset 由于文件大小被分成多个部分。要下载并提取完整数据集,请按照以下步骤操作:
-
从提供的链接下载数据集部分 (
train_variations.tar.part0,train_variations.tar.part1,train_variations.tar.part2)。 -
下载所有部分后,使用以下命令合并它们:
bash cat train_variations.tar.part* > train_variations.tar
该命令将三个部分合并为一个
train_variations.tar文件。
合并和提取数据集
合并部分后,使用以下命令提取 .tar 文件:
bash tar -xvf train_variations.tar
这将把完整数据集提取到适当的目录中。
数据集结构
/genview/ /data/ /imagenet/ /train/ /train_variations/ /train_variations.txt /val/ /test/
引用
如果使用此数据集,请引用:
bibtex @inproceedings{li2024genview, author={Li, Xiaojie and Yang, Yibo and Li, Xiangtai and Wu, Jianlong and Yu, Yue and Ghanem, Bernard and Zhang, Min}, title={GenView: Enhancing View Quality with Pretrained Generative Model for Self-Supervised Learning}, year={2024}, pages={306--325}, booktitle={Proceedings of the European Conference on Computer Vision}, publisher="Springer" }




