five

elsaEU/ELSA500k_track2

收藏
Hugging Face2023-08-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/elsaEU/ELSA500k_track2
下载链接
链接失效反馈
官方服务:
资源简介:
ELSA Multimedia数据集是欧盟项目ELSA的一部分,专门用于多媒体用例。该数据集包含大量使用扩散模型生成的深度伪造图像,旨在开发和评估检测和缓解深度伪造图像在多媒体内容中传播的有效解决方案。深度伪造图像具有高度真实性和欺骗性,对隐私、安全和数字媒体的信任构成重大风险。该数据集可用于训练能够识别和标记深度伪造图像的鲁棒且准确的模型。数据集的结构包括图像和元数据,元数据包含ID、原始提示、正面提示、负面提示、模型、文件路径、推理步骤、图像尺寸、URL、图像、热图标签和热图等信息。数据集分为训练集,包含501,000个样本,总大小为127,788,930,013字节。

ELSA Multimedia数据集是欧盟项目ELSA的一部分,专门用于多媒体用例。该数据集包含大量使用扩散模型生成的深度伪造图像,旨在开发和评估检测和缓解深度伪造图像在多媒体内容中传播的有效解决方案。深度伪造图像具有高度真实性和欺骗性,对隐私、安全和数字媒体的信任构成重大风险。该数据集可用于训练能够识别和标记深度伪造图像的鲁棒且准确的模型。数据集的结构包括图像和元数据,元数据包含ID、原始提示、正面提示、负面提示、模型、文件路径、推理步骤、图像尺寸、URL、图像、热图标签和热图等信息。数据集分为训练集,包含501,000个样本,总大小为127,788,930,013字节。
提供机构:
elsaEU
原始信息汇总

数据集概述

数据集名称: ELSA - Multimedia use case

数据集内容: 包含Deep Fake图像,由扩散模型生成。

数据集目的: 用于开发检测和缓解多媒体内容中深度伪造图像的解决方案。

数据集特征:

  • id: 字符串类型
  • original_prompt: 字符串类型
  • positive_prompt: 字符串类型
  • negative_prompt: 字符串类型
  • model: 字符串类型
  • filepath: 字符串类型
  • num_inference_steps: 整数类型
  • width: 整数类型
  • height: 整数类型
  • url: 字符串类型
  • image: 图像类型
  • heatmap_labels: 字符串序列类型
  • heatmaps: 浮点数序列类型

数据集分割:

  • train: 包含501000个样本,总大小为127788930013字节。

下载大小: 54902331553字节

数据集大小: 127788930013字节

许可证: cc-by-4.0

数据集结构: 每个parquet文件包含近1000张图像及一个包含元数据的JSON文件。

元数据:

  • ID: Laion图像ID
  • original_prompt: Laion提示
  • positive_prompt: 用于图像生成的正面提示
  • negative_prompt: 用于图像生成的负面提示
  • model: 用于图像生成的模型
  • filepath: 伪造图像的文件路径
  • heatmaps: 扩散注意力归因图
  • heatmap_labels: 与热图相关的单词

数据集维护者:

  • Leonardo Labs
  • UNIMORE
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作