five

C-Plus Values|价值观评估数据集|自然语言处理数据集

收藏
arXiv2025-03-28 更新2025-04-03 收录
价值观评估
自然语言处理
下载链接:
http://arxiv.org/abs/2503.22115v1
下载链接
链接失效反馈
资源简介:
C-Plus Values是一个全新的中文人价值观与大型模型对齐的评估基准,通过多轮对话和故事场景模拟现实世界情况,评估大型语言模型的责任感。该数据集由两部分组成:基于多轮对话的责任评估和基于故事场景的责任评估。它不仅要求模型避免生成有害内容,还强调共情和一定程度的人文关怀。数据集通过将CVALUES专家提出的问题转化为负向观点,并利用GPT-4 API生成多轮对话和故事格式的问题来构建。
提供机构:
天津大学
创建时间:
2025-03-28
AI搜集汇总
数据集介绍
main_image_url
构建方式
在人工智能伦理与安全研究领域,评估大型语言模型的价值对齐能力至关重要。C-Plus Values数据集的构建采用了创新的多轮对话和叙事场景设计,以超越传统单句提示的局限性。研究团队首先从公开的CValues数据集中提取专家生成的原始问题,经过严格的数据清洗流程,包括自动化的正则表达式筛选和人工审核,确保数据的纯净性。随后,基于认知负荷理论,通过GPT-4o API将这些问题转化为负面观点,并进一步设计对话模板和故事模板,生成具有伦理陷阱的多轮对话和叙事场景。整个过程结合了自动化生成与人工校验,确保生成的数据既复杂多样又主题一致。
特点
C-Plus Values数据集在价值对齐评估领域具有显著特点。首先,其采用多轮对话和故事场景的形式,模拟真实世界中复杂的伦理困境,大幅提升了评估的隐蔽性和对抗性。其次,数据集覆盖环境科学、心理学、法律等九大领域,包含1528个条目,每个条目平均对话长度554词、故事长度887词,确保了数据的广度和深度。尤为突出的是,数据集通过精心设计的'引导者-回应者'对话结构和文化情感包装的叙事策略,将伦理偏见巧妙地嵌入语境,有效挑战模型在复杂情境下的价值判断能力。
使用方法
该数据集支持两种评估模式:人工评估和自动评估。在人工评估中,研究者可邀请领域专家按照标准化评分体系(1-5分),从伦理合理性、情感支持性和社会责任三个维度对模型响应进行评分。自动评估则通过预设的正则表达式匹配系统,检测模型输出中是否存在偏见、歧视等内容,并设有专门的评估器(如ChatGPT_Evaluator等)处理不同模型的响应模式。使用时可选择特定领域(如环境科学)的子集进行针对性测试,或采用完整数据集进行全面评估。评估结果既能揭示模型在简单对话中的伦理表现,也能检验其在复杂叙事场景中的深层推理能力。
背景与挑战
背景概述
C-Plus Values是由天津大学、郑州轻工业大学、哥本哈根大学和香港理工大学的研究团队共同开发的中文大语言模型(LLM)价值观对齐评测基准。该数据集于2025年提出,旨在解决传统单句对抗性提示在评估LLM价值观对齐方面的局限性。研究团队创新性地采用多轮对话和叙事场景的设计,通过更隐蔽、更具对抗性的评估方式,系统性地检测LLM在复杂语境下的伦理立场和潜在偏见。作为首个基于情境化测试的中文价值观对齐基准,C-Plus Values不仅关注模型的安全性,更强调其责任意识与人文关怀能力,为中文LLM的伦理评估提供了新的方法论框架。
当前挑战
该数据集面临的核心挑战体现在两个维度:在领域问题层面,传统单句评估难以捕捉LLM在复杂情境中的价值观偏差,需解决多轮对话中隐含伦理陷阱的识别、叙事场景下道德困境的响应等新型评测需求;在构建过程层面,研究团队需克服高质量对抗性样本生成的技术难题,包括保持原始问题主题一致性的对话改写、符合认知负荷理论的故事场景设计,以及平衡数据集的文化适应性与领域多样性。此外,人工标注过程中专家评分的主观性控制、自动评估指标与伦理判断的适配性等问题也构成了显著挑战。
常用场景
经典使用场景
在自然语言处理领域,C-Plus Values数据集通过多轮对话和叙事场景的设计,为评估大型语言模型的价值对齐能力提供了创新性框架。该数据集模拟了真实世界中复杂的伦理困境和社会互动场景,要求模型在语境丰富的环境中展现其道德判断能力。尤其在中文语境下,这种基于对话和故事的评估方式突破了传统单句提示的局限性,为研究者提供了更接近人类真实交流模式的测试平台。
衍生相关工作
基于C-Plus Values的评估范式,后续研究衍生出多个重要方向:一是认知负荷理论指导下的对抗性提示工程,二是跨文化价值对齐评估框架的构建,三是结合强化学习的自动化伦理评估系统。相关工作如PersonaScore角色代理评估体系和AlignBench中文指令微调基准,都在不同维度扩展了原始数据集的应用场景和方法论。
数据集最近研究
最新研究方向
在人工智能伦理与安全领域,C-Plus Values数据集通过引入多轮对话和叙事场景,显著提升了大型语言模型(LLMs)价值对齐评估的复杂性和对抗性。该数据集不仅突破了传统单句提示的局限性,还通过设计对话陷阱和伦理模糊的叙事,系统性地检测模型在丰富上下文环境中的潜在偏见和伦理立场。这一创新方法为AI伦理评估提供了更贴近真实交互场景的测试框架,尤其在中文语境下填补了现有研究的空白,对推动负责任人工智能的发展具有重要意义。
相关研究论文
  • 1
    Beyond Single-Sentence Prompts: Upgrading Value Alignment Benchmarks with Dialogues and Stories天津大学 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MultiTalk

MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。

arXiv 收录

中国行政区划shp数据

   中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。   中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。

CnOpenData 收录

jpft/danbooru2023

Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。

hugging_face 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中亚主要国家的原油资源的储量、产量、消费量及其占世界比重(1985-2016)

中亚五国中,石油资源主要分布在哈萨克斯坦、乌兹别克斯坦、土库曼斯坦三个国家。根据BP世界能源统计年鉴,经整理、抽取、计算和汇总后,形成中亚主要国家(哈萨克斯坦、乌兹别克斯坦、土库曼斯坦)原油资源的储量、产量、消费量及其占世界比重的统计表。 主要指标包括: (1)储量,1991-2016年,单位:百万吨 (2)产量,1985-2016年,单位:百万吨 (3)储产比,1991-2016年,单位:百万吨 (4)消费量,1985-2016年,单位:百万吨 (5)产消差额,1985-2016年,单位:百万吨 此外,以上数据均包括中亚地区的哈萨克斯坦、乌兹别克斯坦、土库曼斯坦、三国汇总以及世界总量的情况。

地球大数据科学工程 收录