SAID (Social media AI Detection)

Name: SAID (Social media AI Detection)
Creator: 上海财经大学
Published: 2023-10-12 19:35:24
License: 暂无描述

arXiv2023-10-12 更新2024-06-21 收录

下载链接：

https://github.com/SLAM-group/SAID

下载链接

链接失效反馈

官方服务：

资源简介：

SAID是由上海财经大学开发的一个新型基准数据集，用于评估AI文本检测模型在真实社交媒体平台上的能力。该数据集包含了来自知乎和Quora等流行社交媒体平台的真实AI生成文本，旨在解决AI生成文本在社交媒体上的滥用问题。SAID通过收集真实的AI生成内容，提供了一个更真实和具有挑战性的评估环境。数据集的创建过程中，利用了Zhihu平台自动检测标签来确定AI生成文本的真实性。SAID的应用领域主要集中在提高AI生成文本的检测准确性，以及探索人类识别AI生成文本的能力。

SAID is a novel benchmark dataset developed by Shanghai University of Finance and Economics, tailored for evaluating the performance of AI text detection models on real-world social media platforms. This dataset includes authentic AI-generated texts sourced from mainstream social media platforms such as Zhihu and Quora, with the goal of addressing the abuse of AI-generated texts on social media. By collecting real-world AI-generated content, SAID provides a more realistic and challenging evaluation environment. During the dataset construction process, the automatic detection tags provided by the Zhihu platform were leveraged to confirm the authenticity of the AI-generated texts. The primary application scopes of SAID focus on enhancing the detection accuracy of AI-generated texts and investigating human ability to identify such texts.

提供机构：

上海财经大学

创建时间：

2023-10-12

搜集汇总

数据集介绍

构建方式

在社交媒体AI检测领域，构建能够反映真实场景的数据集至关重要。SAID数据集通过从知乎和Quora等主流社交平台直接爬取真实的AI生成文本，突破了传统基准依赖模拟数据的局限。其构建过程首先利用平台提供的“疑似AI创作”标签作为初始AI文本池，随后基于用户行为假设——若用户的部分回答被标记为AI生成，则该用户的其他回答也倾向于为AI生成，从而扩展了数据覆盖范围。为确保数据质量，研究团队实施了严格的过滤策略，仅保留字符长度超过250且发布于2023年3月后的回答，以契合ChatGPT普及后的时间节点，从而构建了一个既真实又具挑战性的评估基准。

使用方法

SAID数据集主要用于评估现有AI文本检测模型在真实社交平台上的性能。研究人员可将其分为训练集与测试集，利用准确率、精确率、召回率和F1分数等指标，对如GPTZero、HelloSimpleAI和MPU等检测器进行系统评估。数据集特别支持用户导向的AI文本检测任务，该任务不仅分析单个响应内容，还整合用户的其他响应作为上下文信息，通过最大池化、平均池化或多层感知机等架构提升检测效果。这种使用方法强调了用户信息在实践中的重要性，为开发更鲁棒且实用的检测模型提供了有效途径。

背景与挑战

背景概述

随着人工智能生成文本在社交媒体等在线平台的广泛传播，其在带来内容创作自动化与个性化变革的同时，也引发了关于虚假信息传播与舆论操纵的严峻风险。为应对这一挑战，上海财经大学的研究团队于2023年推出了SAID（社交媒体AI检测）基准数据集。该数据集创新性地从知乎、Quora等真实社交媒体平台爬取实际存在的AI生成文本，旨在评估检测模型在现实复杂环境中的性能。其核心研究问题聚焦于如何更准确、更实用地识别社交媒体中由大型语言模型生成的文本，以弥补现有基准多依赖于模拟生成数据、难以反映真实场景中规避策略的不足。SAID的建立不仅为AI生成文本检测领域提供了更为贴近现实的评估标准，其关于人类识别能力的高精度发现也促使学界重新审视在AI深度融合时代下的人机辨识边界，对推动检测技术的实用化发展具有显著影响力。

当前挑战

SAID数据集所应对的核心领域挑战在于社交媒体场景下AI生成文本的精准检测问题。与传统的图像分类或文本分类任务不同，社交媒体中的AI文本常伴随改写、润色等主动规避策略，且与人类创作内容在风格和主题上高度交织，使得单纯基于文本特征的检测模型面临泛化性不足、准确率显著下降的困境。在数据集构建过程中，研究团队遭遇了多重挑战：首要难题是真实AI文本的标注获取，依赖于平台提供的“疑似AI生成”标签作为初始种子，并通过用户级扩展假设来推断未标注内容，这一过程的可靠性需严格验证；其次，数据收集需跨越不同语言与文化背景的社交媒体平台（如中文知乎与英文Quora），确保所识别特征具有跨平台一致性；此外，过滤短文本与设定时间阈值以聚焦于ChatGPT普及后的内容，亦是对数据质量与时效性把控的考验。这些构建挑战共同塑造了SAID数据集的高复杂性与现实代表性。

常用场景

经典使用场景

在社交媒体内容安全与信息真实性验证领域，SAID数据集为评估AI生成文本检测模型提供了高度逼真的测试环境。该数据集通过从知乎和Quora等主流社交平台爬取真实的AI生成内容，构建了一个反映实际网络环境中用户复杂策略的基准。研究者利用SAID对现有检测器进行性能评估，揭示其在面对真实场景中经过修饰或规避处理的AI文本时的局限性，从而推动检测技术向更实用、更鲁棒的方向演进。

解决学术问题

SAID数据集有效解决了AI生成文本检测研究中基准与现实脱节的核心问题。传统基准多基于模拟生成的数据，难以捕捉真实社交平台上AI用户采用的文本修改、复述等规避策略。SAID通过提供来自真实平台的标注数据，使研究者能够更准确地评估检测模型在实际应用中的性能，并重新审视人类对AI文本的辨识能力——其研究显示熟悉LLM的用户辨识准确率高达96.5%，这对早期关于人类无法区分AI文本的结论提出了重要修正。

实际应用

在实际应用中，SAID数据集为社交媒体平台的内容审核机制提供了关键的改进依据。平台可借助该数据集训练或优化AI文本检测系统，以更精准地识别并管理AI生成的虚假信息、误导性内容或自动化营销信息。此外，SAID支持的用户导向检测挑战强调结合用户历史响应进行综合判断，该方法可集成至平台后台，通过分析用户行为模式提升对批量AI生成账号的识别效率，从而增强网络空间的真实性与可信度。

数据集最近研究