MentalManip

github2024-06-04 更新2024-06-06 收录

下载链接：

https://github.com/audreycs/MentalManip

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了对对话中精神操纵的细粒度分析，提供了三个数据集文件，分别包含详细的对话信息、最终标签以及基于共识和多数投票策略的标注结果。每个数据集文件详细列出了对话的唯一标识符、对话文本、操纵结果、技术结果和脆弱性结果等。

This dataset contains fine-grained analyses of psychological manipulation in conversations. It includes three dataset files, which respectively contain detailed conversation information, final labels, and annotation results based on consensus and majority voting strategies. Each dataset file comprehensively lists the unique conversation identifier, conversation text, manipulation outcomes, technical outcomes, vulnerability outcomes, and other relevant details.

创建时间：

2024-05-24

原始信息汇总

数据集概述

数据集名称

MentalManip: 用于对话中精神操控的细粒度分析的数据集。

数据集来源

该数据集是ACL24接受论文MentalManip: A Dataset For Fine-grained Analysis of Mental Manipulation in Conversations的一部分，旨在解决自然语言处理领域中关于精神操控语言识别的资源和研究稀缺问题。

数据集内容

包含4,000个经过标注的电影对话，用于全面分析精神操控，包括操控技巧和受害者的脆弱性。

数据集结构

mentalmanip_dataset目录下包含以下三个数据集：
1. mentalManip_detailed.csv: 包含每个对话及其三个标注者的详细信息。
2. mentalmanip_con.csv: 使用共识协议策略得到的最终标签。
3. mentalmanip_maj.csv: 使用多数协议策略得到的最终标签。

数据集应用

用于评估和改进模型在识别和分类操控性对话内容方面的性能。

数据集访问

数据集可通过此处获取。

数据集统计分析

提供代码用于生成论文中的统计图表，包括技巧和脆弱性的分布图、情感分数分布图等。

引用信息

引用格式： bibtex @inproceedings{MentalManip, title={MentalManip: A Dataset For Fine-grained Analysis of Mental Manipulation in Conversations}, author={Yuxin Wang, Ivory Yang, Saeed Hassanpour, Soroush Vosoughi}, booktitle={the Association for Computational Linguistics}, year={2024} }

搜集汇总

数据集介绍

构建方式

在人际交流中，心理操纵是一种隐蔽且复杂的行为，其识别依赖于对对话上下文的深入理解。MentalManip数据集的构建旨在填补这一领域的研究空白，通过精心挑选和标注的4,000段电影对话，该数据集详细记录了心理操纵的各种技巧及其对受害者的影响。构建过程中，研究团队不仅关注对话内容，还特别强调了操纵技巧与受害者脆弱点的关联，确保数据集能够支持对心理操纵行为的细致分析。

特点

MentalManip数据集的显著特点在于其精细的标注和多维度的分析能力。每段对话不仅被标注了是否包含心理操纵，还详细记录了所使用的操纵技巧和目标受害者的脆弱点。这种多层次的标注使得数据集不仅适用于心理操纵的检测，还能用于深入研究操纵技巧与受害者特征之间的关系。此外，数据集的多样性和真实性确保了其在实际应用中的广泛适用性。

使用方法

使用MentalManip数据集进行研究时，首先需确保环境配置符合要求，包括安装指定的Python包及其版本。数据集的实验代码位于`experiments/`文件夹中，提供了用于操纵检测和技巧与脆弱点分类的具体脚本。用户可以通过提供的示例命令行运行实验，如使用Llama-2-13b模型在零样本提示设置下进行操纵检测。此外，数据集还支持模型微调，以提升对心理操纵内容的识别能力。

背景与挑战

背景概述

在人际交流中，心理操纵是一种显著的滥用形式，其识别因依赖于上下文且往往微妙而具有挑战性。自然语言处理（NLP）领域在识别操纵性语言方面面临资源和研究的匮乏。为填补这一空白，MentalManip数据集应运而生，由4,000个标注的电影对话组成，旨在深入分析心理操纵，识别操纵技巧及其对受害者的影响。该数据集由Yuxin Wang、Ivory Yang、Saeed Hassanpour和Soroush Vosoughi等研究人员于2024年创建，作为ACL'24会议的接受论文，标志着在理解和减轻对话中心理操纵影响方面的重要进展。

当前挑战

MentalManip数据集面临的挑战主要集中在两个方面：一是心理操纵的识别问题，由于其依赖于上下文且表现微妙，现有的领先模型在识别和分类操纵性内容方面表现不足；二是数据集构建过程中的挑战，包括如何准确标注操纵技巧和受害者脆弱性，以及如何通过现有数据集（如心理健康和毒性数据集）进行微调以提升模型性能。尽管尝试通过微调现有数据集来改进模型，但这些努力尚未克服模型在识别操纵性对话方面的局限性。

常用场景

经典使用场景

在自然语言处理领域，MentalManip数据集的经典使用场景主要集中在对话中的心理操纵检测。该数据集通过4,000个标注的电影对话，提供了对心理操纵技术的细致分析，包括操纵手法和目标受害者的脆弱性。研究者可以利用此数据集训练和评估模型，以识别和分类对话中的心理操纵内容，从而提升模型在复杂对话环境中的表现。

衍生相关工作

基于MentalManip数据集，研究者们已经开展了一系列相关工作，包括开发新的心理操纵检测模型和改进现有模型的性能。例如，一些研究通过微调大型语言模型（如Llama-2）来提升其在心理操纵检测任务中的表现。此外，该数据集还激发了对心理操纵行为背后社会和心理机制的进一步探讨，推动了跨学科研究的发展。

数据集最近研究