five

DANI

收藏
Hugging Face2025-08-04 更新2025-08-05 收录
下载链接:
https://huggingface.co/datasets/Renyang/DANI
下载链接
链接失效反馈
官方服务:
资源简介:
DANI(自然与AI图像差异访问)是一个大规模的多模态数据集,旨在为AI生成图像和自然图像的视觉研究提供基准和广泛的应用。该数据集包含超过445,000张图像,包括5,000张自然图像(来自COCO数据集,分辨率分别为224、256、512和1024)以及由多种最先进的生成模型生成的超过440,000张AI图像。每个样本都附带了详细的元数据,支持广泛的视觉和多媒体研究。图像使用多种生成模型和协议生成,包括GALIP、DFGAN、SD_V14等多种模型,支持文本到图像、图像到图像以及文本和图像到图像等多种生成类型。

DANI (Differential Access to Natural and AI-Generated Images) is a large-scale multimodal dataset designed to provide benchmarks and a wide range of applications for visual research on AI-generated and natural images. This dataset contains over 445,000 images, including 5,000 natural images sourced from the COCO dataset with resolutions of 224, 256, 512 and 1024 respectively, as well as more than 440,000 AI-generated images created by a variety of state-of-the-art generative models. Each sample is accompanied by detailed metadata to support extensive visual and multimedia research. The images are generated using multiple generative models and protocols, including GALIP, DFGAN, SD_V14 and other models, supporting various generation types such as text-to-image, image-to-image, and text-and-image-to-image.
创建时间:
2025-08-01
原始信息汇总

DANI数据集概述

数据集简介

  • 名称: DANI (Discrepancy Accessing for Natural and AI Images)
  • 类型: 大规模多模态数据集
  • 用途: 用于AI生成图像(AIGI)和自然图像的视觉研究基准测试
  • 关联论文: D-Judge: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance (ACM MM 2025)

数据集规模

  • 总图像数: 445,000+
    • 自然图像: 5,000 (来自COCO)
    • AI生成图像: 440,000+

数据特征

图像属性

  • 分辨率: 224, 256, 512, 768, 1024
  • 场景类别: indoor, outdoor等
  • 生成类型:
    • Text-to-Image (T2I)
    • Image-to-Image (I2I)
    • Text and Image-to-Image (TI2I)

元数据字段

字段名 描述
index 唯一图像索引
image 图像文件
size 分辨率
category 场景类别
class_id COCO类别ID/名称
model 生成模型名称
gen_type 生成类型
reference 是否为真实图像

覆盖的生成模型

模型 支持分辨率 支持生成类型
GALIP 224 T2I
DFGAN 256 T2I
SD_V14 512 T2I, I2I, TI2I
SD_V15 512 T2I, I2I, TI2I
VD 512 T2I, I2I, TI2I
SD_V21 768 T2I, I2I, TI2I
SD_XL 1024 T2I, I2I, TI2I
Dalle2 512 T2I, I2I
Dalle3 1024 T2I
COCO 224,256,512,1024 真实图像

使用方式

python from datasets import load_dataset ds = load_dataset("Renyang/DANI")

许可协议

  • 类型: CC BY-NC 4.0
  • 用途限制: 非商业研究用途

引用格式

bibtex @inproceedings{liu2024djudge, title = {D-Judge: How Far Are We? Evaluating the Discrepancies Between AI-synthesized Images and Natural Images through Multimodal Guidance}, author = {Liu, Renyang and Lyu, Ziyu and Zhou, Wei and Ng, See-Kiong}, booktitle = {ACM International Conference on Multimedia (MM)}, year = {2025}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与多模态研究领域,DANI数据集通过精心设计的构建流程,整合了来自COCO的5,000张自然图像及超过440,000张由前沿生成模型合成的AI图像。数据采集覆盖GALIP、DFGAN、Stable Diffusion系列(V1.4-V2.1、XL)、DALL·E 2/3等9类生成模型,采用文本生成(T2I)、图像引导生成(I2I)及多模态生成(TI2I)三种范式,并统一标注分辨率、场景类别和生成协议等元数据,形成标准化多维度评估体系。
特点
作为当前规模最大的AI生成与自然图像对比数据集,DANI的突出优势体现在其跨模型覆盖广度与细粒度标注深度。数据集囊括224×224至1024×1024五种分辨率,涵盖室内外等场景类别,每个样本均标注生成模型、创建方式及真实性标签。特别设计的元数据结构支持图像质量评估、风格迁移等跨任务研究,而严格的生成协议控制则为领域适应研究提供了理想基准。
使用方法
研究者可通过Hugging Face数据集库直接加载DANI,调用load_dataset()函数即可获取包含图像文件及完整元数据的结构化对象。数据集默认以PIL图像格式存储,支持通过‘reference’字段快速筛选真实/生成图像,利用‘model’和‘gen_type’字段进行特定生成模型的子集分析。该设计显著简化了跨模型对比实验流程,用户可通过组合不同元数据字段,灵活构建符合特定研究需求的数据子集。
背景与挑战
背景概述
DANI数据集由Renyang Liu等学者于2025年发布,旨在为AI合成图像与自然图像的视觉研究提供大规模基准数据。该数据集由新加坡国立大学等机构联合构建,包含超过44万张AI生成图像及5000张自然图像,覆盖多种生成模型和分辨率规格。作为ACM多媒体会议的研究成果,DANI通过系统化整合Stable Diffusion、DALL-E等前沿生成模型的输出,解决了跨模态视觉研究中缺乏标准化评估数据的关键问题,为图像真实性鉴别、表征学习等任务提供了重要基础设施。
当前挑战
在领域问题层面,DANI需应对AI生成图像与自然图像间日益模糊的视觉边界挑战,包括纹理细节差异、光照一致性等微观特征区分。构建过程中,研究团队面临多模态数据对齐的复杂性,需协调十余种生成模型的不同输出规格;同时确保数据标注的精确性,特别是在处理Text-to-Image等异构生成方式时,需建立统一的元数据标准。此外,保持数据规模与质量平衡,以及处理高分辨率图像存储等技术难题,均为数据集构建的关键挑战。
常用场景
经典使用场景
在计算机视觉领域,DANI数据集为研究者提供了一个全面的基准平台,用于探索AI生成图像与自然图像之间的差异。其经典使用场景包括图像真实性鉴别、风格迁移和图像重建等任务。通过整合多种生成模型和不同分辨率的图像样本,DANI为跨模型比较和性能评估提供了丰富的实验材料。
解决学术问题
DANI数据集解决了AI生成图像与自然图像之间差异量化这一关键学术问题。通过提供大规模、多模态的图像数据,研究者能够深入分析生成模型的视觉缺陷,并开发更精准的鉴别算法。该数据集为图像质量评估、领域适应和多模态理解等研究方向提供了标准化测试环境,推动了生成式AI的可信度研究。
衍生相关工作
基于DANI数据集已衍生出多项重要研究,包括D-Judge基准系统的开发,该系统通过多模态引导评估图像差异。相关研究还探索了生成模型的脆弱性模式,提出了新型的对抗样本检测方法。在跨域适应方向,研究者利用DANI的标注信息开发了改进的风格迁移算法,显著提升了生成图像的视觉保真度。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作