Fake2M
收藏Sentry-Image 数据集概述
数据集描述
Sentry-Image 数据集用于检测AI生成的图像,包含训练、验证和测试数据集。数据集分为图像数据和元数据两部分,分别存储在 ImageData 和 MetaData 文件夹中。
数据下载
数据集可通过以下命令从 huggingface 下载: shell git lfs install git clone https://huggingface.co/datasets/InfImagine/FakeImageDataset
数据组织结构
数据集的目录结构如下:
FakeImageDataset/ ├── ImageData/ │ ├── train/ │ │ ├── IFv1-CC1M/ │ │ ├── SDv15R-CC1M/ │ │ └── stylegan3-80K/ │ └── val/ │ ├── IF-CC95K/ │ ├── Midjourneyv5-5K/ │ ├── SDv15-CC30K/ │ ├── SDv21-CC15K/ │ ├── cogview2-22K/ │ └── stylegan3-60K/ └── MetaData/ ├── train/ │ ├── IF-CC1M.csv │ ├── SDv15R-CC1M.csv │ └── stylegan3-80K.csv └── val/ ├── IF-CC95K.csv ├── Midjourneyv5-5K.csv ├── SDv15-CC30K.csv ├── SDv21-CC15K.csv ├── cogview2-22K.csv ├── stylegan3-60K.csv └── stylegan3-80K.csv
训练数据集 (Fake2M)
| 数据集 | 生成器 | 数量 | 分辨率 | 图像数据路径 | 元数据路径 |
|---|---|---|---|---|---|
| SD-V1.5Real-dpms-25 | Diffusion | 1M | 512 | ImageData/train/SDv15R-CC1M | MetaData/train/SDv15R-CC1M.csv |
| IF-V1.0-dpms++-25 | Diffusion | 1M | 256 | ImageData/train/IFv1-CC1M | MetaData/train/IF-CC1M.csv |
| StyleGAN3 | GAN | 87K | >=512 | ImageData/train/stylegan3-80K | MetaData/train/stylegan3-80K.csv |
验证数据集 (MPBench)
| 数据集 | 生成器 | 数量 | 分辨率 | 图像数据路径 | 元数据路径 |
|---|---|---|---|---|---|
| SDv15 | Diffusion | 30K | 512 | ImageData/val/SDv15-CC30K | MetaData/val/SDv15-CC30K.csv |
| SDv21 | Diffusion | 15K | 512 | ImageData/val/SDv21-CC15K | MetaData/val/SDv21-CC15K.csv |
| IF | Diffusion | 95K | 256 | ImageData/val/IF-CC95K | MetaData/val/IF-CC95K.csv |
| Cogview2 | AR | 22K | 480 | ImageData/val/cogview2-22K | MetaData/val/cogview2-22K.csv |
| StyleGAN3 | GAN | 60K | >=512 | ImageData/val/stylegan3-60K | MetaData/val/stylegan3-60K.csv |
| Midjourneyv5 | - | 5K | >=512 | ImageData/val/Midjourneyv5-5K | MetaData/val/Midjourneyv5-5K.csv |
其他信息
- 美学质量评分:提供基于 CLIP-IQA 的美学评分,可从 huggingface 下载。
- 可视化:提供数据集的可视化文件。
维护计划
- 2023.7:发布训练和验证数据集。
- 2023.8:发布开放问卷。
- 2023.9:支持 Stable Diffusion XL 假图像数据集。
- 2023.9:发布训练和评估代码。
- 2023.10:支持 Midjourney V5 假图像数据集。
- 2023.10:发布新的测试数据集。
许可证
该项目基于 Apache-2.0 许可证开源,学术研究可免费使用,商业用途需书面许可。
引用
请在引用时注明以下信息:
@misc{sentry-image-leaderboard, title = {Sentry-Image Leaderboard}, author = {Zeyu Lu, Di Huang, Chunli Zhang, Chengyue Wu, Xihui Liu, Lei Bai, Wanli Ouyang}, year = {2023}, publisher = {InfImagine, Shanghai AI Laboratory}, howpublished = "url{https://github.com/Inf-imagine/Sentry}" } @inproceedings{lu2023seeing, title = {Seeing is not always believing: Benchmarking Human and Model Perception of AI-Generated Images}, author = {Zeyu Lu, Di Huang, Lei Bai, Jingjing Qu, Chengyue Wu, Xihui Liu, Wanli Ouyang}, booktitle = {Advances in Neural Information Processing Systems}, year = {2023}, }




