gaslighting
收藏Hugging Face2025-02-22 更新2025-02-23 收录
下载链接:
https://huggingface.co/datasets/Maxwe11y/gaslighting
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两种对话类型的两个会话数据集:gaslighting和anti-gaslighting。gaslighting对话是用户和LLM助手之间的对话,助手使用gaslighting策略诱导用户自我怀疑、自我责备和困惑。而anti-gaslighting对话中,LLM助手通过支持性语言提供安慰和鼓励。数据集分为训练集(1752次对话)、验证集(124次对话)和测试集(124次对话)。数据集以Apache-2.0许可证授权。
创建时间:
2025-02-21
搜集汇总
数据集介绍

构建方式
gaslighting数据集的构建是基于模拟用户与大型语言模型(LLM)助手之间的对话,其中gaslighting对话旨在诱导用户产生自我怀疑、自我责备和困惑,而anti-gaslighting对话则通过支持性语言提供安慰和鼓励。该数据集分为训练集、验证集和测试集,共包含2120个对话,数据采集和处理的细节在相关论文中有详细描述。
特点
本数据集的特点在于其独特的对话内容,涉及情感操控和反操控的情景,对于研究大型语言模型在情感交互和心理健康领域的影响具有重要的价值。数据集采用Apache-2.0许可证,语言为英语,适用于文本生成和填充掩码等任务。此外,数据集的构建注重伦理和隐私保护,避免了个人敏感信息的泄露。
使用方法
该数据集的使用限于研究目的,用户在使用时应注意伦理考量,避免不当或恶意使用。数据集的结构包括对话ID、对话轮数、说话者名称、角色、内心想法、发言内容和发言类别等字段。用户可以通过HuggingFace Hub提供的平台访问和下载该数据集,并按照Apache-2.0许可证的规定进行使用和分享。
背景与挑战
背景概述
在自然语言处理领域,对话系统的设计与优化始终是研究的热点。gaslighting数据集的创建,旨在探索与评估大型语言模型在对话中采用心理操纵策略的能力。该数据集由Dr. Wei Li精心策划,并在2024年通过论文《Can a large language model be a gaslighter?》对外公布,其研究背景源于对语言模型在交互中可能产生的负面影响进行深入分析的需求。该数据集包含两类对话:一类是采用心理操纵策略的gaslighting对话,另一类是提供支持和鼓励的反gaslighting对话。数据集划分为训练集、验证集和测试集,共计约2000条对话记录,全部采用英语进行。gaslighting数据集的推出,为研究对话系统中的心理操纵策略提供了新的视角和资源,对相关领域产生了积极影响。
当前挑战
gaslighting数据集的构建过程中,研究者面临了多项挑战。首先,如何精确地定义和捕捉心理操纵策略在对话中的表现,是构建数据集的一大难题。其次,确保数据集的多样性和代表性,避免偏见和误导,也是数据集构建过程中需要考虑的问题。此外,由于涉及敏感内容,如何确保数据集的安全使用,避免对用户造成不良影响,是对研究者提出的又一挑战。在使用该数据集时,研究者需谨慎处理对话内容,充分考虑到伦理和隐私的问题,确保研究过程的合规性。
常用场景
经典使用场景
在文本生成与对话模拟领域,gaslighting数据集以其独特的对话内容而被广泛关注。该数据集的经典使用场景在于模拟并研究情感操纵行为,即一方利用心理战术使另一方产生自我怀疑和困惑。通过此数据集,研究者可以训练模型识别并回应此类操纵策略,进而提升对话系统的情商和应对复杂情感互动的能力。
解决学术问题
gaslighting数据集解决了学术界在情感操纵识别与应对策略研究中的数据缺乏问题。它为研究者提供了一个实验平台,以探究大型语言模型在处理有毒和操纵性对话中的表现,这对于提高模型在现实世界应用中的鲁棒性和道德性具有深远意义。
衍生相关工作
基于gaslighting数据集,学术界已经衍生出一系列相关工作,如情感操纵的检测与评估、对话系统的道德使用准则制定等。这些研究不仅推动了对话系统的技术进步,也促进了人工智能伦理在实践中的应用和发展。
以上内容由遇见数据集搜集并总结生成



