five

Fake3DGS

收藏
arXiv2026-04-30 更新2026-05-02 收录
下载链接:
https://github.com/iot-unimore/Fake3DGS
下载链接
链接失效反馈
官方服务:
资源简介:
Fake3DGS是由摩德纳和雷焦艾米利亚大学团队构建的3D伪造检测基准数据集,包含41,000条经过几何、外观和空间布局操控的3D高斯泼溅场景及其渲染视图。数据集源自UCO3D基础场景,通过GaussCtrl和Instruct-GS2GS两种方法生成逼真编辑样本,并采用量化压缩技术将原始7TB数据缩减至200GB。该数据集旨在解决3D神经渲染内容真实性评估问题,为3D-aware取证技术提供标准化测试平台,推动多视图一致性分析和3D伪造检测算法的发展。

Fake3DGS is a 3D forgery detection benchmark dataset developed by the team from the University of Modena and Reggio Emilia, which includes 41,000 3D Gaussian Splatting scenes and their rendered views that have been manipulated in terms of geometry, appearance and spatial layout. Derived from the basic UCO3D scenes, the dataset generates realistic edited samples through two methods, GaussCtrl and Instruct-GS2GS. Quantization compression technology is adopted to reduce the original 7TB data to 200 GB. This dataset aims to address the problem of authenticity evaluation for 3D neural rendering content, provide a standardized test platform for 3D-aware forensics technologies, and promote the development of multi-view consistency analysis and 3D forgery detection algorithms.
提供机构:
摩德纳和雷焦艾米利亚大学
创建时间:
2026-04-30
原始信息汇总

Fake3DGS 数据集概述

Fake3DGS 是一个用于神经渲染中三维篡改检测的基准数据集,相关论文发表于 ICPR 2026。

数据集内容

  • 数据集包含两类样本
    • 原始样本(original_samples):未经篡改的样本。
    • 编辑样本(edited_samples):经过篡改的样本。
  • 格式:数据集以 nerfstudio checkpoints 压缩文件形式提供。
  • 下载链接

数据预处理

下载后需使用 extract_data.py 文件进行处理,将每个高斯溅射特征提取到 .pkl 文件中。示例命令:

bash python extract_data.py --input_dir root/Fake3DGS/original_compressed/ --output_dir gaussian_pickels/real --label 0

若为编辑样本,则 --label 1

训练

使用 train.py 进行模型训练,示例命令:

bash python -u train.py -bs 4 -e 8 --config mixed_training.pkl --name new_mixed --resume new_mixed_5.pth

参数说明

  • --bs:批次大小。
  • -e:训练轮数。
  • --config:配置文件(.pkl 文件)。
  • --name:训练名称。
  • --resume:恢复训练的检查点文件。

测试

  1. 下载预训练权重:checkpoint.pth 并放置在 checkpoints/ 文件夹中。
  2. 运行测试命令:

bash python -u test.py -bs 4 --test_set "mixed_training.pkl" --ckpt "checkpoints/best.pth"

参数说明

  • --bs:批次大小。
  • --ckpt:加载的模型权重。
  • --test_set:测试配置文件(.pkl 文件)。

引用

若在项目中使用该数据集,请引用以下论文:

bibtex @inproceedings{ddinuccifake3dgs, title={Fake3DGS: A Benchmark for 3D Manipulation Detection in Neural Rendering}, author={Di Nucci, Davide and Catalini, Riccardo and Borghi, Guido and Vezzani, Roberto}, booktitle={Twentyeighth International Conference on Pattern Recognition}, year=2026 }

搜集汇总
数据集介绍
main_image_url
构建方式
随着三维重建与神经渲染技术的飞速发展,特别是3D高斯泼溅(3D Gaussian Splatting)的普及,对三维场景进行高逼真度编辑并重新渲染已变得简便易行。然而,这同时也引发了关于三维内容真实性的严峻安全挑战,而当前的研究多局限于二维伪造检测,三维场景的真实性评估尚属空白。为填补这一空白,Fake3DGS数据集应运而生。该数据集基于UCO3D中的大量物体三维高斯泼溅重建结果,通过两种主流编辑方法——GaussCtrl与Instruct-GS2GS——对原始场景的几何、外观及空间布局进行受控篡改,从而生成对应的伪造场景。为确保编辑的多样性与类间平衡,研究团队利用大语言模型(Llama-3)自动为每个场景生成三类编辑描述(改变材质、背景或颜色),并随机分配至各场景。最终,数据集包含超过41,000个重建场景,其中原始与伪造样本各半,所有模型均以nerfstudio格式存储,并采用SOGS压缩策略以显著降低存储开销。
特点
Fake3DGS数据集的核心特点在于其开创性地聚焦于三维层面的伪造检测,突破了传统二维伪造检测的范式。区别于传统的基于像素或纹理痕迹的二维检测,Fake3DGS直接以完整的三维高斯泼溅场景表示作为研究对象,覆盖了从几何结构到外观属性的多维度篡改类型,且编辑结果具有高度的视觉真实感与视角一致性,使得传统的二维检测器难以仅凭渲染图像中的伪影进行区分。数据集结构设计精巧,包含混合分割与跨编辑方法分割等多种评估协议,旨在全面检验检测模型在已知与未知编辑方法下的泛化能力。此外,借助SOGS压缩技术,整个数据集从近7TB缩减至约200GB,极大提升了在标准硬件上的可用性与复现性,为三维内容真实性评估的研究提供了首个标准化的大规模基准。
使用方法
Fake3DGS数据集专为三维伪造检测任务设计,支持多种评估协议的使用。使用者可直接加载压缩后的nerfstudio格式检查点,获取包含高斯均值坐标、不透明度、尺度、四元数旋转及球谐系数等参数的三维场景表示。对于基于图像的方法,可从每个场景渲染多视角图像,并利用这些图像对现有的二维深度伪造检测器(如CLIP、DINOv2、CoDE等)进行微调与评估。尤为重要的是,数据集提供了混合分割(80%训练/20%测试)与跨编辑方法分割(在一种编辑方法上训练,在另一种上测试)两种标准协议,用以衡量检测器对不同编辑管线(GaussCtrl与Instruct-GS2GS)的泛化性能。研究者还可直接利用本文提出的三维检测框架Fake3DD,其基于PointTransformerV3架构,直接处理高斯泼溅属性,通过全局平均池化获得场景级嵌入,从而完成二分类任务,展现出在跨编辑场景下远超二维方法的鲁棒性。
背景与挑战
背景概述
随着神经渲染技术的迅猛发展,尤其是三维高斯泼溅(3D Gaussian Splatting)的兴起,三维场景的编辑与高保真重渲染变得前所未有的便捷与普及。然而,这一技术飞跃也催生了全新的安全隐忧:经过细致操控的三维内容在视觉上几乎难辨真假,而现有的取证研究却长期局限于二维空间。为填补这一空白,摩德纳和雷焦艾米利亚大学的研究人员于2025年创建了Fake3DGS数据集。该数据集以超过41,000个真实与经编辑的三维高斯泼溅场景为核心,通过控制几何、外观与空间布局的修改生成逼真的伪造渲染视图,旨在系统性地定义和推动三维伪造检测这一新兴研究领域。其发布不仅为公平比较不同检测方法提供了标准化基准,更深刻揭示了二维检测器在三维伪造内容面前的脆弱性,对数字取证与信息安全领域产生了深远影响。
当前挑战
该数据集所解决的领域问题在于,传统的二维深度伪造检测方法面对由三维高斯泼溅生成的视图一致性、高真实感的伪造内容时,其基于像素级或纹理级伪影的检测策略几乎失效。由于三维编辑可产生无限数量的逼真且视角一致的图像,传统检测方法难以捕捉跨编辑方法的通用伪造痕迹。在构建过程中,核心挑战在于如何规模化地生成多样且真实的伪造三维场景。研究团队需平衡超过1000个类别的场景分布,并确保编辑操作覆盖背景、对象外观与材料替换等多种类型,同时避免重建质量差异对检测评估的干扰。此外,将原始约7TB的数据通过量化与压缩降至约200GB,以在保持高保真度的同时实现大规模训练与评估的可行性,亦是数据处理上的关键挑战。
常用场景
经典使用场景
Fake3DGS数据集的核心经典用途在于为三维深度伪造检测这一新兴任务提供标准化的评估基准。随着三维高斯泼溅(3D Gaussian Splatting)技术的成熟,对三维场景进行几何、外观及空间布局的编辑变得简单高效,且能渲染出高度逼真的多视角一致图像,传统基于二维像素伪影的检测手段在此情境下几乎失效。该数据集通过系统性地采集原始与经多种编辑方法操作后的三维高斯场景,并配套提供对应的渲染视图,为研究者搭建了一个公平、可复现的竞技场,用以测评和比较各类检测算法在三维编辑场景下的鲁棒性与泛化能力。
实际应用
在实际应用层面,Fake3DGS数据集具有广泛而深远的潜力。在增强现实(AR)与虚拟现实(VR)内容审核中,该数据集可作为验证数字孪生或虚拟场景是否被恶意篡改的检测工具;在自动驾驶模拟管线中,传感器仿真场景的真实性检验可借助该数据集训练的模型实现,防止因环境信息被操纵导致决策系统的误判。此外,在数字取证、知识产权保护以及新闻影像真实性核查等场景中,针对三维高斯场景的伪造检测技术能有效识别技术性篡改,维护视觉信息的公信力。
衍生相关工作
围绕Fake3DGS数据集衍生了一系列重要的学术工作。直接基于该数据集,研究者提出了首个三维感知伪造检测框架Fake3DD,通过改造PointTransformerV3架构以处理高斯图元的高层属性(如不透明度、尺度与三维坐标),实现了远超二维检测器的跨编辑方法泛化能力。该数据集还促进了多视角一致性分析、基于高斯特征空间的不一致性挖掘等新方向的研究,并启发了后续工作对编辑区域定位与细粒度篡改检测的探索。这些衍生工作共同推动了三维视觉安全这一交叉领域的快速演进与体系化发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作