five

wassname/daily_dilemmas-self

收藏
Hugging Face2026-04-30 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/wassname/daily_dilemmas-self
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是`kellycyy/daily_dilemmas`的一个子集,转换为对称的每价值标签。每行代表上游数据集中的一个`(困境, 行动)`对,仅限于`party == You`的原始行。价值标签以对称的`{-1, 0, +1}`列表示:`+1`表示该行动是该标签的价值对齐方,`-1`表示相反行动是价值对齐方,`0`表示标签在双方都缺失或出现在双方并被移除作为模糊重复信号。数据集经过预处理,保留了至少有一个显式`You`价值的困境对,并按标签计数降序排序。

This dataset is a subset of `kellycyy/daily_dilemmas`, converted into symmetric per-value labels. One row per `(dilemma, action)` from the upstream dataset, restricted to the raw rows where `party == You`. Value tags are represented as symmetric columns in `{-1, 0, +1}`: `+1` means this action is the value-aligned side of the pair for that tag, `-1` means the opposite action is the value-aligned side, and `0` means the tag was absent on both sides or appeared on both sides and was removed as ambiguous duplicate signal. The dataset is preprocessed to keep only dilemma pairs with at least one remaining explicit-`You` value, then sorted by label count descending.
提供机构:
wassname
搜集汇总
数据集介绍
main_image_url
构建方式
daily_dilemmas-self数据集源自kellycyy/daily_dilemmas,经过精细预处理构建而成。首先,仅保留原始数据中party字段精确等于“You”的行,确保决策主体的明确性。随后,剔除同一困境中同时出现在to_do与not_to_do两侧的重复价值标签,以消除歧义。最后,对剩余的价值标签进行对称化处理,仅保留至少包含一个明确“You”的困境对,并按标签数量降序排列,形成每个(困境, 行动)对应一行的结构化数据。
特点
该数据集以对称的价值标签列为核心特色,标签取值于{-1, 0, +1}:+1表示当前行动为该价值对齐的一侧,-1表示相反行动为对齐侧,0表示标签缺失或两侧均出现而被移除。聚焦于明确使用“You”的困境子集,避免了上游数据中决策主体不一致(如John、The mother等)的混淆。包含固定列如困境情境、行动描述、负面后果等,此外所有价值标签列均经过分词、小写化、去重及频次过滤,确保数据干净且语义明确。
使用方法
使用HuggingFace的datasets库即可加载该数据集,例如ds = load_dataset("wassname/daily_dilemmas-self", split="test")。每个样本包含固定列与价值标签列,可通过列名筛选出价值列,并根据行中取值+1或-1识别正向或负向价值标签。在评估模型时,对同一困境的两个行动使用相同的提示模板(如“My choice: Yes/No”),并将模型对行动的偏好乘以其对应的标签值,无需额外的符号处理即可直接计算价值对齐度。
背景与挑战
背景概述
在大语言模型伦理对齐的研究前沿,如何量化模型在日常生活道德困境中的价值偏好成为关键议题。2024年,由Yu Ying Chiu、Liwei Jiang与Yejin Choi等学者构建的DailyDilemmas数据集应运而生,该数据集收录了涵盖多元情境的道德困境案例,为评估语言模型的价值一致性提供了标准化基准。wassname团队在此基础上开发的daily_dilemmas-self子集,通过精炼的对称化标签处理,将原始数据中模糊的‘当事人’指代统一为明确的‘You’视角,从而生成更纯净的价值判断信号。这一改进显著降低了数据噪声,使得模型对特定价值观的偏好测量更具可解释性与可靠性,为后续研究者在道德推理、价值嵌入等领域的探索铺平了道路。
当前挑战
该数据集所面临的挑战具有双重性。在领域问题层面,核心困局在于道德困境的复杂性与主观性——同一场景下不同文化、社群对‘正确行为’的定义常存分歧,导致单一标签难以涵盖多元价值取向;而语言模型的价值对齐不仅需要识别显性道德规则,更需捕捉隐含在语境中的伦理优先级排序,这对标注体系的设计构成严峻考验。在构建过程中,原始数据存在‘当事人’指代混乱(如‘You’与‘The mother’混用)、价值标签在to_do与not_to_do两侧重复出现等歧义问题,需通过严格过滤、去重与对称化处理来确保标签一致性。此外,部分困境的价值标签稀疏性也增加了模型从有限样本中泛化推理的难度。
常用场景
经典使用场景
在人工智能伦理与价值对齐的研究领域中,情感与道德困境的量化评估始终是核心议题。DailyDilemmas-Self数据集作为kellycyy/daily_dilemmas的精炼子集,通过严格的预处理流程,将原始数据中不一致的责任主体标签统一为明确的“You”视角,并采用对称化的价值观标签编码(+1表示价值对齐行为,-1表示对立行为,0表示无相关性),构建了一个高度结构化且干净的评估基准。研究者可借助此数据集,直接用于测试大型语言模型在日常生活道德困境中的价值取向,通过对比模型对不同行为的偏好分数与数据集标注,精准衡量模型与人类价值观的契合程度。该设计显著降低了传统评估中因数据噪声带来的混杂效应,为价值对齐研究提供了可靠的实验平台。
实际应用
在现实应用层面,DailyDilemmas-Self数据集为开发更符合人类伦理规范的对话系统、决策辅助工具和内容审核模型提供了关键测试资源。例如,在智能客服或心理健康聊天机器人的开发中,工程师可以加载本数据集,利用标准化提示模板询问模型对特定困境中不同行为的选择,并依据对称化标签快速计算模型对诸如“诚实”“善良”“公正”等核心价值的遵从程度。这种评估方式能够帮助开发者识别模型在复杂、微妙的生活场景中潜在的伦理偏差,从而在部署前进行针对性的价值调优或安全过滤。此外,该数据集还可用于自动化的合规性检测,确保AI系统的输出与组织价值观或行业行为准则保持一致,降低道德风险。
衍生相关工作
DailyDilemmas-Self的出现催生了一系列围绕价值对齐与道德推理的衍生研究工作。基于其精心设计的对称标签和纯净的“You”视图,研究者开发了多种模型行为分析工具,例如通过主成分分析或聚类算法从价值观偏好矩阵中提取模型的核心伦理维度。另一类典型工作是构建多模型对比基准,利用该数据集系统性地比较不同规模、不同训练策略的语言模型在道德判断上的一致性差异。此外,该数据集还被用作强化学习中的奖励模型标注语料,帮助训练代理在模拟日常交互中学习价值对齐的决策策略。这些衍生工作共同推动了从道德哲学理论到机器学习实践的交叉融合,使得抽象的伦理原则能够被编码为可计算、可验证的模型评价指标。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作