WITNESS’ Truly Innovative and Effective AI Detection (TRIED) Benchmark

Name: WITNESS’ Truly Innovative and Effective AI Detection (TRIED) Benchmark
Creator: WITNESS
Published: 2025-05-01 21:38:27
License: 暂无描述

arXiv2025-05-01 更新2025-05-13 收录

下载链接：

http://arxiv.org/abs/2504.21489v2

下载链接

链接失效反馈

官方服务：

资源简介：

WITNESS的TRIED基准是一个新的框架，用于评估检测工具，这些工具基于它们在现实世界中的影响和创新能力。该基准旨在解决生成式AI和欺骗性合成媒体对全球信息生态系统的威胁，特别是在全球多数地区。TRIED基准强调检测工具必须适应不同的语言、文化和技术环境，投资于可解释性，并且能够无缝集成到更广泛的验证流程中。该基准旨在推动创新，保护公众信任，增强AI素养，并有助于建立一个更具弹性的全球信息可信度。

The WITNESS TRIED Benchmark is a novel framework for evaluating detection tools based on their real-world impact and innovative capabilities. This benchmark aims to address the threats posed by generative AI and deceptive synthetic media to the global information ecosystem, particularly in most regions across the globe. The TRIED Benchmark emphasizes that detection tools must adapt to diverse linguistic, cultural, and technological contexts, invest in explainability, and enable seamless integration into broader verification workflows. This benchmark is designed to drive innovation, protect public trust, enhance AI literacy, and contribute to building a more resilient global information credibility landscape.

提供机构：

WITNESS

创建时间：

2025-04-30

搜集汇总

数据集介绍

构建方式

WITNESS的TRIED基准数据集通过整合前沿的生成式AI检测技术与社会技术评估框架，采用多阶段构建方法：首先基于全球咨询和实际案例收集多样化合成媒体样本，涵盖不同语言、文化背景及质量层级的音视频内容；其次通过红队测试和跨学科专家评审进行对抗性验证，确保数据集覆盖低分辨率、社交平台压缩格式等现实场景；最后建立动态更新机制，持续纳入新型深度伪造技术样本以保持数据时效性。数据集构建过程严格遵循伦理准则，避免监控用途的数据采集，并嵌入可解释性标注体系。

特点

该数据集的核心特征体现在三维度创新：1) 社会技术平衡性，首次将检测准确率与公平性、可解释性等社会因素纳入统一评估框架，包含针对全球南方地区的低带宽环境优化样本；2) 场景复杂性，专门采集含背景噪音、多人对话、无线电传输等干扰因子的真实案例，占比达总样本量的43%；3) 评估系统性，配套开发的检查清单量化工具涵盖设计、开发、测试等全生命周期，设置177项指标点对点验证工具效能。特别包含16种非拉丁语系语言样本和7类边缘案例，弥补现有检测工具的文化盲区。

使用方法

使用本数据集需采用分层验证策略：首先通过基准检查清单对检测工具进行合规性评分，识别其在特定文化语境或技术场景下的薄弱环节；其次利用数据集的对抗样本库进行压力测试，评估工具对新型深度伪造技术的泛化能力；最终结合社会技术评估矩阵，从准确性、可访问性等六个维度生成综合效能报告。研究人员可提取模块化子集进行针对性改进，如仅使用音频篡改样本优化语音检测模型。所有分析需遵循数据集附带的伦理使用协议，禁止将检测结果作为法律证据直接使用。

背景与挑战

背景概述

WITNESS' Truly Innovative and Effective AI Detection (TRIED) Benchmark是由WITNESS组织于2025年提出的一个创新性AI检测评估框架。该数据集旨在应对生成式AI和欺骗性合成媒体在全球信息生态系统中日益增长的威胁，特别是在资源有限的地区。TRIED Benchmark的提出基于WITNESS在Deepfakes Rapid Response Force (DRRF)项目中的实践经验，该项目为事实核查员、记者和民间社会行动者提供AI检测工具和专业知识。该数据集的核心研究问题是如何在真实世界的复杂场景中有效评估AI检测工具的性能，包括其可解释性、公平性、可访问性和上下文相关性。TRIED Benchmark的影响力体现在它为开发者和政策制定者提供了一个全面的评估框架，以确保AI检测工具不仅在技术上先进，而且在实际应用中真正有效。

当前挑战

TRIED Benchmark面临的挑战主要包括两个方面：领域问题的挑战和构建过程中的挑战。在领域问题方面，该数据集旨在解决AI检测工具在真实世界场景中的性能不足问题，包括对低质量、压缩和重格式内容的检测能力，以及对多语言、多文化和多技术环境的适应性。这些挑战在资源有限的地区尤为突出，因为这些地区的媒体生态系统脆弱，且缺乏对AI媒体的普遍认知。在构建过程中，挑战包括如何确保训练数据的多样性和代表性，如何处理数据隐私和伦理问题，以及如何设计一个能够持续更新和适应新技术发展的评估框架。此外，如何在透明度和安全性之间找到平衡，以防止对抗性攻击，也是一个重要的挑战。

常用场景

经典使用场景

WITNESS的TRIED基准数据集在检测生成式AI和合成媒体的真实世界应用中扮演了关键角色。该数据集通过整合多语言、多文化和多技术背景的案例，为开发者和研究者提供了一个全面的评估框架，特别适用于检测低质量、高压缩和复杂背景下的合成媒体内容。

实际应用

在实际应用中，TRIED基准被广泛用于支持事实核查员、记者和人权工作者验证合成媒体的真实性。例如，在非洲和南亚等资源有限的地区，该基准帮助本地化检测工具，使其能够适应低带宽和高压缩环境下的媒体验证需求。

衍生相关工作

TRIED基准启发了多项相关研究，包括开发针对特定语言和文化背景的检测工具，以及改进对抗性攻击的鲁棒性。例如，基于该基准的DeFake.app项目专门为记者设计，提供了用户友好的界面和透明的检测结果解释。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集