SAID (Social media AI Detection)
收藏arXiv2023-10-12 更新2024-06-21 收录
下载链接:
https://github.com/SLAM-group/SAID
下载链接
链接失效反馈官方服务:
资源简介:
SAID是由上海财经大学开发的一个新型基准数据集,用于评估AI文本检测模型在真实社交媒体平台上的能力。该数据集包含了来自知乎和Quora等流行社交媒体平台的真实AI生成文本,旨在解决AI生成文本在社交媒体上的滥用问题。SAID通过收集真实的AI生成内容,提供了一个更真实和具有挑战性的评估环境。数据集的创建过程中,利用了Zhihu平台自动检测标签来确定AI生成文本的真实性。SAID的应用领域主要集中在提高AI生成文本的检测准确性,以及探索人类识别AI生成文本的能力。
SAID is a novel benchmark dataset developed by Shanghai University of Finance and Economics, tailored for evaluating the performance of AI text detection models on real-world social media platforms. This dataset includes authentic AI-generated texts sourced from mainstream social media platforms such as Zhihu and Quora, with the goal of addressing the abuse of AI-generated texts on social media. By collecting real-world AI-generated content, SAID provides a more realistic and challenging evaluation environment. During the dataset construction process, the automatic detection tags provided by the Zhihu platform were leveraged to confirm the authenticity of the AI-generated texts. The primary application scopes of SAID focus on enhancing the detection accuracy of AI-generated texts and investigating human ability to identify such texts.
提供机构:
上海财经大学
创建时间:
2023-10-12
搜集汇总
数据集介绍

构建方式
在社交媒体AI检测领域,构建能够反映真实场景的数据集至关重要。SAID数据集通过从知乎和Quora等主流社交平台直接爬取真实的AI生成文本,突破了传统基准依赖模拟数据的局限。其构建过程首先利用平台提供的“疑似AI创作”标签作为初始AI文本池,随后基于用户行为假设——若用户的部分回答被标记为AI生成,则该用户的其他回答也倾向于为AI生成,从而扩展了数据覆盖范围。为确保数据质量,研究团队实施了严格的过滤策略,仅保留字符长度超过250且发布于2023年3月后的回答,以契合ChatGPT普及后的时间节点,从而构建了一个既真实又具挑战性的评估基准。
使用方法
SAID数据集主要用于评估现有AI文本检测模型在真实社交平台上的性能。研究人员可将其分为训练集与测试集,利用准确率、精确率、召回率和F1分数等指标,对如GPTZero、HelloSimpleAI和MPU等检测器进行系统评估。数据集特别支持用户导向的AI文本检测任务,该任务不仅分析单个响应内容,还整合用户的其他响应作为上下文信息,通过最大池化、平均池化或多层感知机等架构提升检测效果。这种使用方法强调了用户信息在实践中的重要性,为开发更鲁棒且实用的检测模型提供了有效途径。
背景与挑战
背景概述
随着人工智能生成文本在社交媒体等在线平台的广泛传播,其在带来内容创作自动化与个性化变革的同时,也引发了关于虚假信息传播与舆论操纵的严峻风险。为应对这一挑战,上海财经大学的研究团队于2023年推出了SAID(社交媒体AI检测)基准数据集。该数据集创新性地从知乎、Quora等真实社交媒体平台爬取实际存在的AI生成文本,旨在评估检测模型在现实复杂环境中的性能。其核心研究问题聚焦于如何更准确、更实用地识别社交媒体中由大型语言模型生成的文本,以弥补现有基准多依赖于模拟生成数据、难以反映真实场景中规避策略的不足。SAID的建立不仅为AI生成文本检测领域提供了更为贴近现实的评估标准,其关于人类识别能力的高精度发现也促使学界重新审视在AI深度融合时代下的人机辨识边界,对推动检测技术的实用化发展具有显著影响力。
当前挑战
SAID数据集所应对的核心领域挑战在于社交媒体场景下AI生成文本的精准检测问题。与传统的图像分类或文本分类任务不同,社交媒体中的AI文本常伴随改写、润色等主动规避策略,且与人类创作内容在风格和主题上高度交织,使得单纯基于文本特征的检测模型面临泛化性不足、准确率显著下降的困境。在数据集构建过程中,研究团队遭遇了多重挑战:首要难题是真实AI文本的标注获取,依赖于平台提供的“疑似AI生成”标签作为初始种子,并通过用户级扩展假设来推断未标注内容,这一过程的可靠性需严格验证;其次,数据收集需跨越不同语言与文化背景的社交媒体平台(如中文知乎与英文Quora),确保所识别特征具有跨平台一致性;此外,过滤短文本与设定时间阈值以聚焦于ChatGPT普及后的内容,亦是对数据质量与时效性把控的考验。这些构建挑战共同塑造了SAID数据集的高复杂性与现实代表性。
常用场景
经典使用场景
在社交媒体内容安全与信息真实性验证领域,SAID数据集为评估AI生成文本检测模型提供了高度逼真的测试环境。该数据集通过从知乎和Quora等主流社交平台爬取真实的AI生成内容,构建了一个反映实际网络环境中用户复杂策略的基准。研究者利用SAID对现有检测器进行性能评估,揭示其在面对真实场景中经过修饰或规避处理的AI文本时的局限性,从而推动检测技术向更实用、更鲁棒的方向演进。
解决学术问题
SAID数据集有效解决了AI生成文本检测研究中基准与现实脱节的核心问题。传统基准多基于模拟生成的数据,难以捕捉真实社交平台上AI用户采用的文本修改、复述等规避策略。SAID通过提供来自真实平台的标注数据,使研究者能够更准确地评估检测模型在实际应用中的性能,并重新审视人类对AI文本的辨识能力——其研究显示熟悉LLM的用户辨识准确率高达96.5%,这对早期关于人类无法区分AI文本的结论提出了重要修正。
实际应用
在实际应用中,SAID数据集为社交媒体平台的内容审核机制提供了关键的改进依据。平台可借助该数据集训练或优化AI文本检测系统,以更精准地识别并管理AI生成的虚假信息、误导性内容或自动化营销信息。此外,SAID支持的用户导向检测挑战强调结合用户历史响应进行综合判断,该方法可集成至平台后台,通过分析用户行为模式提升对批量AI生成账号的识别效率,从而增强网络空间的真实性与可信度。
数据集最近研究
最新研究方向
在人工智能生成文本检测领域,SAID数据集正推动研究向更贴近真实社交媒体的复杂场景深化。该数据集通过采集知乎和Quora平台的实际AI生成内容,构建了一个反映现实用户行为与规避策略的评估基准,挑战了传统基于模拟数据的检测模型性能。前沿研究聚焦于用户导向的检测新范式,即结合用户历史响应等多源信息提升判别准确率,实验表明该方法能显著优化检测效果。同时,数据集揭示了在AI技术广泛渗透的当下,熟悉大型语言模型的标注者能以高达96.5%的准确率区分人机文本,这促使学界重新审视人类在动态环境中的认知能力,并为开发更鲁棒、实用的检测工具提供了关键方向。
相关研究论文
- 1Who Said That? Benchmarking Social Media AI Detection上海财经大学 · 2023年
以上内容由遇见数据集搜集并总结生成



