ethical_coconot_6pack_care

Hugging Face2025-12-16 更新2025-12-17 收录

下载链接：

https://huggingface.co/datasets/Bachstelze/ethical_coconot_6pack_care

下载链接

链接失效反馈

官方服务：

资源简介：

Ethical CoCoNot Reasoning是一个基于伦理推理的数据集，扩展自'The art of saying no: contextual noncompliance in language models'。它通过添加基于6pack.care伦理原则的推理列，实现了对拒绝决策的透明解释。数据集来源于原始Coconut数据集的平衡子集，推理轨迹是通过deepseek-r1t2-chimera生成并手动筛选的。数据集包含训练集和测试集，分别有772和194个示例。数据集的创建过程参考了'The Art of Saying No'的原始数据集收集方法。

创建时间：

2025-12-11

原始信息汇总

数据集概述

数据集基本信息

数据集名称: Ethical CoCoNot Reasoning
托管地址: https://huggingface.co/datasets/Bachstelze/ethical_coconot_6pack_care
作者: Kalle Hilsenbek
年份: 2025

数据集来源与扩展

基础数据集: 本数据集是对原始 Coconut 数据集的一个平衡子集的扩展。
理论依据: 扩展工作基于论文 The art of saying no: contextual noncompliance in language models 的思想。
伦理框架: 新增的推理列是基于 6pack.care 的伦理原则构建的。

数据集内容与结构

数据特征

数据集包含以下字段：

id: 标识符
category: 类别
subcategory: 子类别
prompt: 用户提示
reasoning: 基于伦理框架的推理过程
response: 模型的简短回应

数据划分

训练集: 包含 772 个样本，大小约为 1,560,434.97 字节。
测试集: 包含 194 个样本，大小约为 392,130.03 字节。
总数据集大小: 约 1,952,565 字节。
下载大小: 1,124,549 字节。

数据创建方法

原始数据收集: 请参阅 The Art of Saying No 论文第 3 节了解原始数据集的收集细节。
推理生成: 推理轨迹是在 deepseek-r1t2-chimera 的帮助下生成并经过人工筛选的。

生成提示框架

数据生成遵循特定的系统提示和用户提示模板，其伦理推理基于“6-Pack of Care”关怀伦理框架，该框架包含六个组成部分：

识别中的专注性
参与中的责任性
行动中的能力
适应中的响应性
社区中的团结性
视野中的共生性

加载方式

python from datasets import load_dataset

加载测试集

coconot_eval = load_dataset("Bachstelze/ethical_coconot_6pack_care", split="test")

加载训练集

coconot_train = load_dataset("Bachstelze/ethical_coconot_6pack_care", split="train")

许可信息

CoCoNot 数据集在 ODC-BY 许可下提供，使用者需遵守其后续组成部分的许可条款。

引用格式

@dataset{ethical-coconot-6pack-care, title={{Ethical CoCoNot Reasoning}}, author={Kalle Hilsenbek}, url={https://huggingface.co/datasets/Bachstelze/ethical_coconot_6pack_care}, year={2025} }

搜集汇总

数据集介绍

构建方式

在人工智能伦理对齐的研究领域，数据集构建的严谨性至关重要。Ethical CoCoNot Reasoning 数据集以原始 CoCoNot 数据集为基础，精心筛选出一个平衡的子集，并植入了基于关怀伦理学的 6-Pack of Care 框架。其核心构建步骤在于，借助深度语言模型生成每条拒绝响应的道德推理轨迹，随后通过人工筛选确保推理的准确性与框架的一致性，从而在数据层面实现了决策过程的透明化与可解释性。

特点

该数据集的核心特征在于其独特的结构化设计，它不仅包含了用户请求与模型拒绝响应，更创新性地引入了详尽的道德推理链。每条数据均标注了请求的类别与子类别，使得分析能够深入到具体情境。其推理内容严格遵循关怀伦理学的六大原则，但表述上避免直接提及框架术语，旨在提供自然、客观的上下文分析，最终导向一个经过深思熟虑的、恰当的拒绝结论，为研究模型的可解释对齐提供了高质量语料。

使用方法

在自然语言处理与人工智能伦理的交叉研究中，该数据集主要用于训练与评估具备可解释拒绝能力的大型语言模型。使用者可通过 Hugging Face `datasets` 库便捷加载训练集与测试集。典型应用场景包括：基于提供的系统提示词与用户提示词模板，微调模型以生成符合伦理框架的推理与响应；或是在测试集上评估现有模型拒绝请求时的逻辑连贯性与伦理一致性，推动透明、可信的AI系统发展。

背景与挑战

背景概述

在人工智能伦理对齐研究领域，如何使大型语言模型具备符合人类价值观的拒绝与解释能力，已成为一项关键议题。Ethical CoCoNot Reasoning数据集由研究人员Kalle Hilsenbek于2025年构建，它基于艾伦人工智能研究所（Allen Institute for AI）先前发布的CoCoNot数据集进行扩展。该数据集的核心研究问题聚焦于为模型的不合规响应提供透明化的伦理推理轨迹，其创新之处在于引入了基于关怀伦理的“6-Pack of Care”框架，旨在使模型不仅能够识别并拒绝不当请求，还能以符合伦理原则的方式阐释其决策依据。这项工作深化了模型可解释性与价值对齐的结合，为构建更负责任、更可信赖的人工智能系统提供了重要的数据基础。

当前挑战

该数据集致力于应对的领域挑战在于，如何使语言模型在面临有害、偏见或不完整的用户请求时，能够生成既符合安全规范又具备伦理可解释性的拒绝回应。这要求模型超越简单的合规性判断，深入理解并应用复杂的伦理框架进行多维度推理。在数据构建过程中，主要挑战体现在高质量推理轨迹的生成与筛选上。尽管借助了先进模型进行初步生成，但为确保推理的准确性、一致性以及与“6-Pack of Care”框架的深度契合，仍需进行大量的人工审核与过滤工作，这一过程对标注者的伦理素养与专业知识提出了较高要求，也构成了数据集构建的核心难点。

常用场景

经典使用场景

在人工智能伦理对齐领域，该数据集为研究语言模型在复杂情境下的道德推理能力提供了关键资源。其经典使用场景聚焦于训练和评估模型如何依据关怀伦理框架，对用户请求进行审慎的非合规回应。通过提供带有详细推理过程的拒绝响应，数据集支持模型学习在保持助人本性的同时，嵌入透明的伦理决策机制，从而促进对齐技术从简单规则过滤向深度价值理解的演进。

实际应用

在实际部署中，该数据集能够指导开发更负责任、可信赖的对话系统。例如，在客服、教育或心理咨询等敏感领域，AI助手可借鉴数据集中的推理模式，对涉及隐私、安全或伦理边界的用户请求，生成既友善又立场明确的拒绝回应。这种能力不仅提升了人机交互的安全性与可靠性，也使得AI的行为更符合社会规范与专业伦理，为高风险场景下的AI应用提供了重要的安全护栏设计参考。

衍生相关工作

该数据集衍生自经典的CoCoNot非合规数据集，并融入了关怀伦理学的理论框架，这一结合催生了一系列关注解释性对齐的研究。相关工作沿着两个方向展开：一是利用此类带推理的数据对模型进行监督微调或推理过程蒸馏，以提升其伦理决策的可解释性；二是基于该数据集构建更细粒度的评估基准，用于衡量不同对齐技术（如RLHF、宪法AI）在复杂伦理场景下的表现，从而推动了可解释对齐技术路线图的形成与发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集