FakeClue
收藏FakeVLM 数据集概述
数据集简介
FakeVLM 是一个专门用于检测合成图像和 DeepFake 的大型多模态模型。该模型不仅能够有效区分真实图像与合成图像,还能提供清晰的自然语言解释,增强模型的可解释性。FakeVLM 模型在多个数据集上进行了广泛评估,证明了其在真实性分类和伪影解释任务中的优越性。
数据集内容
- FakeClue 数据集:包含超过 100,000 张图像,涵盖七个类别,并附有细粒度的伪影线索的自然语言注释。
- LOKI 数据集:用于评估多模态模型在合成检测任务中的表现,包含人类注释的细粒度图像伪影,涵盖动物、人类、风景和文档等类别。
- DD-VQA 数据集:用于解释面部伪影的数据集,采用 VQA 格式的手动注释,伪影包括模糊的发际线、不匹配的眉毛、僵硬的瞳孔和不自然的阴影。
数据集结构
数据集目录结构如下:
playground
└──data
└──train
|--doc
|--fake
|--real
.
.
|--satellite
└──test
.
.
.
数据集贡献
- 提出了 FakeVLM 模型,用于一般合成图像和 DeepFake 检测任务,具有出色的伪影解释能力。
- 引入了 FakeClue 数据集,包含丰富的图像类别和细粒度的伪影注释。
- 在多个数据集上进行了广泛评估,证明了模型在合成检测和异常伪影解释任务中的卓越性能。
数据集结果
FakeVLM 在 FakeClue、LOKI 和 DD-VQA 三个数据集上的表现优于其他七个领先的多模态模型,特别是在合成检测和伪影解释任务中表现突出。
引用
如果您使用该数据集或模型,请引用以下文献: shell @misc{wen2025spotfakelargemultimodal, title={Spot the Fake: Large Multimodal Model-Based Synthetic Image Detection with Artifact Explanation}, author={Siwei Wen and Junyan Ye and Peilin Feng and Hengrui Kang and Zichen Wen and Yize Chen and Jiang Wu and Wenjun Wu and Conghui He and Weijia Li}, year={2025}, eprint={2503.14905}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2503.14905}, }
联系方式
如有任何问题或建议,请联系:466439420gh@gmail.com




