HatefulIllusion_Dataset
收藏HatefulIllusion_Dataset 数据集概述
数据集基本信息
- 数据集名称: HatefulIllusion_Dataset
- 发布者/维护者: yiting
- 许可证: MIT
- 标签: Hateful, Unsafe, AI-generated, Optical_Illusions
- 数据集卡片联系人: yiting.qu@cispa.de
数据集来源与目的
- 本数据集生成并用于论文: Hate in Plain Sight: On the Risks of Moderating AI-Generated Hateful Illusions (ICCV 2025)
- 论文链接: https://arxiv.org/pdf/2507.22617
- 重要声明: 本数据集包含有害内容,仅可用于研究或教育目的。
数据集内容与规模
- 数据集包含 2,160 张(仇恨性)AI生成的光学错觉图像,这些图像隐藏了三种类型的消息:
- digits (数字): 10条消息,300张AI生成的错觉图像。
- hate slangs (仇恨俚语/仇恨言论): 23条消息,690张AI生成的错觉图像。
- hate symbols (仇恨符号): 39条消息,1,170张AI生成的错觉图像。
- 每张图像均由研究团队仔细标注为以下三个可见性类别之一:
- 无可见性 (0): 隐藏信息完全不可见。
- 低可见性 (1): 隐藏信息隐约可见。
- 高可见性 (2): 隐藏信息清晰易见。
数据集结构
数据集包含三个配置(子集),通过 config_name 指定:
- digits (默认配置): 数据文件位于
digits/metadata.jsonl - hate_slangs: 数据文件位于
hate_slangs/metadata.jsonl - hate_symbols: 数据文件位于
hate_symbols/metadata.jsonl
数据字段说明
每个数据样本包含以下字段:
| 字段名 | 类型 | 描述 |
|---|---|---|
| image | string |
主光学错觉图像文件的相对路径(例如:"images/img_001.png")。 |
| condition_image | string |
辅助条件图像文件的相对路径(例如:"messages/cond_001.png")。 |
| message | string |
描述嵌入目标概念(数字、俚语、符号等)的文本。 |
| prompt | string |
用于生成光学错觉的提示词。 |
| visibility | int (0,1,2) |
表示隐藏内容可检测程度的可见性分数。0->无可见性;1->低可见性;2->高可见性。 |
使用方法
加载数据集的示例代码如下: python from datasets import load_dataset from huggingface_hub import snapshot_download
repo_id = "yiting/HatefulIllusion_Dataset" local_dir = "data/HatefulIllusion_Dataset"
snapshot_download(repo_id, repo_type="dataset", local_dir=local_dir)
subset = "digits" # 可替换为 "hate_slangs" 或 "hate_symbols" dataset = load_dataset(local_dir, subset)["train"] print(dataset[0])
引用信息
如需引用本数据集,请使用以下BibTeX格式:
@inproceedings{QYMBZ25, author = {Yiting Qu and Ziqing Yang and Yihan Ma and Michael Backes and Yang Zhang}, title = {{Hate in Plain Sight: On the Risks of Moderating AI-Generated Hateful Illusions}}, booktitle = {{IEEE International Conference on Computer Vision (ICCV)}}, publisher = {ICCV}, year = {2025} }




