Personalized_Safety_Data
收藏Hugging Face2025-06-01 更新2025-06-02 收录
下载链接:
https://huggingface.co/datasets/wick1d/Personalized_Safety_Data
下载链接
链接失效反馈官方服务:
资源简介:
个性化安全数据集,包含从Reddit和合成数据中获取的14,000个面向大型语言模型(LLMs)的个性化风险数据。该数据集用于评估LLMs在个性化安全方面的性能,并在相关论文《Personalized Safety in LLMs: A Benchmark and A Planning-Based Agent Approach》中进行了介绍。
创建时间:
2025-05-23
搜集汇总
数据集介绍

构建方式
在个性化人工智能安全研究领域,该数据集通过系统化采集Reddit平台上的真实用户提问构建而成。研究人员采用严格的数据匿名化流程,彻底移除用户名、帖子链接等身份标识,仅保留表达心理状态与生活困境的文本内容。每个样本均标注了多维元数据,包括情感状态、人口统计特征和具体情境分类,形成具有丰富上下文信息的结构化语料库。
特点
作为首个专注于大语言模型个性化风险研究的数据集,其核心价值体现在对用户脆弱性场景的深度覆盖。数据集包含8000余条真实世界对话记录,精准标注了提问者的心理健康状态、经济状况等敏感维度,为研究模型在高压情境下的响应机制提供了独特视角。这种对真实困境的细致刻画,突破了传统安全数据集对表面有害内容的局限。
使用方法
该数据集主要应用于三个研究维度:文本生成任务中可训练模型产生共情式回应,分类任务中能识别不同风险等级的用户提问,安全评估任务中可检测模型对敏感话题的处理边界。研究者需遵循非商业使用原则,将数据用于LLM对齐研究时,应着重考察模型在保持安全底线的同时展现的人文关怀能力。
背景与挑战
背景概述
个性化安全数据集作为大语言模型安全研究领域的重要资源,由Yuchen Wu等研究人员于2025年创建。该数据集聚焦于解决大语言模型在面临用户心理脆弱性及社会困境时的响应机制问题,收录了8000余条源自Reddit平台的真实匿名化个人咨询数据。通过结构化标注用户的情感状态、人口统计特征及生活情境等多维元数据,该数据集为探索模型在敏感语境下的共情能力与安全边界提供了实证基础,推动了人机交互伦理研究的发展。
当前挑战
该数据集旨在应对大语言模型在处理个性化风险议题时的核心挑战,包括如何平衡用户情感需求与模型安全边界、如何避免对弱势群体产生二次伤害等复杂伦理问题。在构建过程中,研究团队需克服真实场景数据匿名化处理的技术难点,确保在保留语境有效性的同时彻底消除用户隐私信息,并需通过精细的元数据标注体系将非结构化文本转化为可计算的研究对象。
常用场景
经典使用场景
在大型语言模型安全研究领域,Personalized_Safety_Data数据集为探索个性化风险与情感脆弱性场景提供了重要支持。该数据集通过8000余条真实匿名查询,结合用户心理状态、人口统计特征等结构化元数据,常用于训练模型生成具有共情能力的安全回应。研究者可基于不同情境如健康危机或关系困境,评估模型在敏感输入下的响应质量,推动安全对齐技术的发展。
解决学术问题
该数据集首次系统化解决了LLM面对个性化风险时的安全响应难题。通过标注用户的情感状态与社会经济背景,它助力学术研究突破传统安全范式的局限,为模型在心理脆弱场景下的伦理决策提供实证基础。其结构化元数据支持多维度分析,显著提升了LLM对齐研究中情境感知能力的可量化性,填补了个性化安全评估领域的空白。
衍生相关工作
基于该数据集衍生的经典研究包括规划式代理框架的开发,如引用文献中提出的基准方法,通过结构化推理增强模型对复杂伦理困境的处理能力。后续工作进一步扩展了其在多模态安全评估、跨文化共情建模等方向的应用,催生了如风险敏感微调、情境化对齐评估等一系列创新研究脉络。
以上内容由遇见数据集搜集并总结生成



