five

MentalManip

收藏
arXiv2024-12-11 更新2024-12-13 收录
下载链接:
https://github.com/Anton-Jiayuan-MA/Manip-IAP
下载链接
链接失效反馈
官方服务:
资源简介:
MentalManip数据集是由Wang等人(2024b)引入的,专门用于检测和分类心理操纵的对话数据集。该数据集包含4000个多轮虚构对话,来源于在线电影剧本,并进行了多层次的标注,包括操纵的存在、操纵技巧和目标脆弱性。数据集的创建旨在通过高质量的标注确保数据的一致性和准确性,从而支持心理操纵检测的研究。该数据集主要应用于心理健康领域,旨在通过早期检测心理操纵行为,保护个体的心理健康。
提供机构:
悉尼大学、悉尼科技大学、西交利物浦大学、哈佛大学、新南威尔士大学
创建时间:
2024-12-11
搜集汇总
数据集介绍
main_image_url
构建方式
MentalManip数据集通过从在线电影剧本中提取的多轮虚构对话构建,涵盖了4,000个对话样本。这些对话经过多层次的标注,包括是否存在心理操纵、操纵技巧以及目标脆弱性三个维度。数据集的构建旨在为心理操纵检测和分类提供高质量的训练和测试数据,确保在复杂对话场景中能够有效识别和分析心理操纵行为。
特点
MentalManip数据集的显著特点在于其多层次的标注结构,能够捕捉对话中的心理操纵行为及其具体技巧。此外,数据集中的对话样本来源于虚构场景,确保了对话内容的多样性和复杂性,从而为模型提供了丰富的训练素材。数据集还特别关注操纵行为的隐蔽性和微妙性,这使得其在实际应用中具有较高的实用价值。
使用方法
MentalManip数据集主要用于心理操纵检测任务,研究者可以通过该数据集训练和评估模型在识别对话中的心理操纵行为的能力。使用该数据集时,研究者可以采用不同的提示工程技术,如零样本、少样本和链式思维提示,以及本文提出的意图感知提示(IAP)方法。通过这些方法,模型能够更准确地捕捉对话中参与者的意图,从而提高心理操纵检测的准确性和召回率。
背景与挑战
背景概述
MentalManip数据集由Wang等人于2024年引入,旨在解决对话中隐性心理操纵的检测问题。该数据集由悉尼大学、悉尼科技大学、西交利物浦大学和哈佛大学等多个研究机构合作开发,专注于通过多层次的标注来识别和分类心理操纵行为。其核心研究问题在于如何利用大型语言模型(LLMs)捕捉对话中参与者的潜在意图,从而更准确地检测心理操纵。该数据集的推出为心理健康领域的自然语言处理研究提供了新的方向,尤其是在心理操纵检测这一复杂任务上,具有重要的学术和实际应用价值。
当前挑战
MentalManip数据集的构建面临多重挑战。首先,心理操纵行为具有隐蔽性和复杂性,难以通过简单的语言特征进行识别,这使得数据标注和模型训练变得尤为困难。其次,现有的模型在检测心理操纵时往往存在较高的假阴性率,这意味着许多实际存在的心理操纵行为未被识别,这对心理健康支持系统的早期干预构成了重大障碍。此外,数据集的多样性和泛化能力也是一个挑战,当前仅基于单一数据集的实验限制了模型的广泛应用。未来的研究需要进一步优化模型性能,减少假阴性和假阳性的平衡,并开发更多样化的数据集以验证模型的泛化能力。
常用场景
经典使用场景
MentalManip数据集的经典使用场景主要集中在对话中的心理操控检测。该数据集通过多层次的标注,能够帮助研究人员识别和分类对话中的心理操控行为。具体而言,数据集包含了4000个多轮对话,这些对话来源于在线电影剧本,涵盖了心理操控的存在、操控技巧以及目标脆弱性等多个维度。通过这些标注,研究人员可以利用该数据集训练和验证模型,以检测对话中的心理操控行为,从而提升模型的识别准确性和鲁棒性。
实际应用
在实际应用中,MentalManip数据集可以广泛应用于心理健康支持系统、在线咨询平台以及社交媒体监控等领域。通过检测对话中的心理操控行为,系统可以及时识别潜在的心理健康风险,并提供相应的干预措施。例如,在在线咨询中,系统可以通过分析对话内容,识别出咨询师或用户是否存在心理操控行为,从而确保咨询过程的伦理性和有效性。此外,该数据集还可以用于社交媒体平台的用户行为分析,帮助识别和预防网络欺凌等不良行为。
衍生相关工作
MentalManip数据集的发布催生了一系列相关的经典工作,特别是在心理操控检测和对话分析领域。例如,基于该数据集,研究人员提出了Intent-Aware Prompting(IAP)方法,通过分析对话双方的意图,显著提升了心理操控检测的准确性。此外,该数据集还激发了对大语言模型(LLMs)在心理健康领域应用的进一步研究,如通过零样本、少样本和链式思维(CoT)提示技术,探索更高效的心理操控检测方法。这些工作不仅推动了对话系统的发展,也为心理健康领域的研究提供了新的视角和工具。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作