elsaEU/ELSA500k_track2
收藏Hugging Face2023-08-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/elsaEU/ELSA500k_track2
下载链接
链接失效反馈官方服务:
资源简介:
ELSA Multimedia数据集是欧盟项目ELSA的一部分,专门用于多媒体用例。该数据集包含大量使用扩散模型生成的深度伪造图像,旨在开发和评估检测和缓解深度伪造图像在多媒体内容中传播的有效解决方案。深度伪造图像具有高度真实性和欺骗性,对隐私、安全和数字媒体的信任构成重大风险。该数据集可用于训练能够识别和标记深度伪造图像的鲁棒且准确的模型。数据集的结构包括图像和元数据,元数据包含ID、原始提示、正面提示、负面提示、模型、文件路径、推理步骤、图像尺寸、URL、图像、热图标签和热图等信息。数据集分为训练集,包含501,000个样本,总大小为127,788,930,013字节。
ELSA Multimedia数据集是欧盟项目ELSA的一部分,专门用于多媒体用例。该数据集包含大量使用扩散模型生成的深度伪造图像,旨在开发和评估检测和缓解深度伪造图像在多媒体内容中传播的有效解决方案。深度伪造图像具有高度真实性和欺骗性,对隐私、安全和数字媒体的信任构成重大风险。该数据集可用于训练能够识别和标记深度伪造图像的鲁棒且准确的模型。数据集的结构包括图像和元数据,元数据包含ID、原始提示、正面提示、负面提示、模型、文件路径、推理步骤、图像尺寸、URL、图像、热图标签和热图等信息。数据集分为训练集,包含501,000个样本,总大小为127,788,930,013字节。
提供机构:
elsaEU
原始信息汇总
数据集概述
数据集名称: ELSA - Multimedia use case
数据集内容: 包含Deep Fake图像,由扩散模型生成。
数据集目的: 用于开发检测和缓解多媒体内容中深度伪造图像的解决方案。
数据集特征:
- id: 字符串类型
- original_prompt: 字符串类型
- positive_prompt: 字符串类型
- negative_prompt: 字符串类型
- model: 字符串类型
- filepath: 字符串类型
- num_inference_steps: 整数类型
- width: 整数类型
- height: 整数类型
- url: 字符串类型
- image: 图像类型
- heatmap_labels: 字符串序列类型
- heatmaps: 浮点数序列类型
数据集分割:
- train: 包含501000个样本,总大小为127788930013字节。
下载大小: 54902331553字节
数据集大小: 127788930013字节
许可证: cc-by-4.0
数据集结构: 每个parquet文件包含近1000张图像及一个包含元数据的JSON文件。
元数据:
- ID: Laion图像ID
- original_prompt: Laion提示
- positive_prompt: 用于图像生成的正面提示
- negative_prompt: 用于图像生成的负面提示
- model: 用于图像生成的模型
- filepath: 伪造图像的文件路径
- heatmaps: 扩散注意力归因图
- heatmap_labels: 与热图相关的单词
数据集维护者:
- Leonardo Labs
- UNIMORE



