real-vs-ai-corpus
收藏Hugging Face2026-03-19 更新2026-03-20 收录
下载链接:
https://huggingface.co/datasets/Zitacron/real-vs-ai-corpus
下载链接
链接失效反馈官方服务:
资源简介:
Real vs AI Corpus 是一个大规模的二分类图像数据集,专为训练AI图像检测器而设计。该数据集由Zitacron从17个公开的HuggingFace数据源流式合并而成,无需中间本地存储。数据集包含真实图像和AI生成图像两类,总规模在1000万到1亿之间。每个样本包含以下字段:image(PIL格式的RGB图像)、label(0表示真实图像,1表示AI生成图像)、label_text("real"或"ai"的文本标签)、source_dataset(来源数据集的HuggingFace仓库ID)和source_license(来源数据集的SPDX许可证ID)。所有组成数据源均采用CC BY 4.0、Apache 2.0或MIT许可证,完全可用于商业用途。使用该数据集训练的模型可以不受限制地用于商业用途,但需要遵守相应的归属要求。该数据集特别适用于计算机视觉领域的AI图像检测任务。
创建时间:
2026-03-15



