five

OpenTuringBench

收藏
Hugging Face2025-04-16 更新2025-04-17 收录
下载链接:
https://huggingface.co/datasets/MLNTeam-Unical/OpenTuringBench
下载链接
链接失效反馈
官方服务:
资源简介:
OpenTuringBench是一个用于训练和评估机器生成文本检测器的开源大型基准和框架,基于开放的大型语言模型(OLLMs)。它支持图灵测试(TT)和作者归属(AA)两种任务,并包含多种挑战性的评估场景,如人机混合、领域转移和未见生成器。
创建时间:
2025-04-14
搜集汇总
数据集介绍
main_image_url
构建方式
OpenTuringBench数据集的构建依托于七种开源大语言模型(OLLMs),通过精心设计的实验范式生成多样化文本。研究团队采用HuffPost新闻数据集作为基础语料,利用不同参数配置的模型生成机器文本,涵盖标准采样、高温采样、模型自改写及人机混合创作等多种生成方式。数据划分遵循科学严谨的评估框架,包含543,091条文本,细分为域内标准测试、域内变体测试和域外泛化测试三大类,每类下设七项具体评估任务,形成层次化的评估体系。
特点
该数据集最显著的特点在于其系统性的挑战性评估维度。不仅包含基础的图灵测试和作者归属任务,更创新性地设计了高温采样文本、大模型生成文本、模型自改写文本、人机协作文本等复杂场景。域外评估部分特别引入论文写作领域文本和未训练模型生成文本,有效检验检测器的泛化能力。数据覆盖7种参数量从3.8B到72B的开源模型,构建了当前最全面的开源模型生成文本检测基准。
使用方法
使用者可通过Hugging Face的datasets库便捷加载不同评估模块。数据集提供三种标准配置:in_domain加载基础测试集,in_domain_variations包含各类域内变体数据,out_of_distribution则整合域外评估素材。研究人员可针对特定任务调用相应分割,如mid_temperature获取高温采样文本,essay加载论文领域数据。配套的OTBDetector框架支持对比学习范式,用户可基于该基准开展检测模型训练与评估工作。
背景与挑战
背景概述
OpenTuringBench是由Lucio La Cava和Andrea Tagarelli于2025年提出的一个基于开放大语言模型(OLLMs)的基准测试框架,旨在解决机器生成文本(MGT)的检测与溯源问题。随着生成式人工智能的广泛应用,区分人类与机器生成文本的挑战日益凸显,该数据集应运而生。OpenTuringBench不仅支持经典的图灵测试(TT),还扩展至作者归属(AA)的多分类任务,涵盖了新闻领域的543,091条文本数据,其中包含41,426条人类文本和501,665条机器生成文本。该数据集的推出为自然语言处理领域提供了重要的研究工具,推动了机器生成文本检测技术的发展。
当前挑战
OpenTuringBench面临的挑战主要体现在两个方面:领域问题的挑战与构建过程的挑战。在领域问题方面,数据集需应对机器生成文本与人类文本的边界模糊问题,尤其是在面对高采样温度文本、模型自我改写文本及人机混合文本等复杂场景时,检测算法的鲁棒性受到严峻考验。构建过程中的挑战则包括数据采集的多样性保障,需要平衡不同模型生成的文本分布,同时确保数据标注的准确性。此外,数据集的扩展性也是一大挑战,需持续纳入新模型生成的文本以保持其前沿性。
常用场景
经典使用场景
在自然语言处理领域,OpenTuringBench数据集被广泛应用于机器生成文本检测和作者归属问题的研究。该数据集通过包含多种开放大语言模型生成的文本,为研究者提供了一个标准化的评估平台。特别是在图灵测试和作者归属任务中,研究者可以利用该数据集进行模型训练和性能评估,从而深入理解机器生成文本的特征和模式。
解决学术问题
OpenTuringBench数据集解决了机器生成文本检测中的多个关键学术问题,包括跨模型泛化能力、领域适应性以及未知生成模型的检测。通过提供丰富的任务场景,如高采样温度文本、领域外文本和未知模型生成文本,该数据集为研究者提供了全面的评估工具,推动了机器生成文本检测技术的进步。
衍生相关工作
基于OpenTuringBench数据集,研究者们开发了多种先进的机器生成文本检测模型和框架,如OTBDetector。这些工作不仅提升了检测精度,还进一步探索了对比学习在文本检测中的应用。此外,该数据集还催生了多项关于机器生成文本特征分析和模型泛化能力的研究。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作