SEV (Scenario–Event with Valence)

Name: SEV (Scenario–Event with Valence)
Creator: 北京智源人工智能研究院
Published: 2025-10-13 20:24:24
License: 暂无描述

arXiv2025-10-13 更新2025-10-15 收录

下载链接：

https://github.com/Aurora-cx/EmotionCircuits-LLM

下载链接

链接失效反馈

官方服务：

资源简介：

SEV数据集是一个用于研究大型语言模型中情感表达和控制的控制数据集。该数据集由480个事件描述组成，每个描述包含一个中性的情景和三个结果事件（积极、中立和消极），以揭示情感在不同上下文中的编码方式。数据集通过半自动生成流程构建，旨在确保情感变化源于事件语义而非词汇情感线索。

The SEV Dataset is a controlled dataset designed for researching emotional expression and control in large language models (LLMs). It consists of 480 event descriptions, each containing a neutral scenario and three outcome events (positive, neutral, and negative), aimed at revealing how emotions are encoded across different contexts. The dataset was constructed via a semi-automated generation pipeline, with the goal of ensuring that emotional variations originate from event semantics rather than lexical emotional cues.

提供机构：

北京智源人工智能研究院

创建时间：

2025-10-13

原始信息汇总

EmotionCircuits-LLM 数据集概述

项目简介

研究大语言模型中的情绪表达机制，通过情绪引导的文本生成和神经回路分析来理解模型如何产生和控制情绪表达。

数据集文件

主数据集：sev.jsonl
测试集：test_set.jsonl
测试输入：user_inputs_test_1.jsonl

数据格式

输入数据格式

json { "skeleton_id": "work_00", "theme": "Work/Job", "scenario": "I completed the project presentation...", "event": { "positive": "The team recognized...", "neutral": "The team received...", "negative": "The team ignored..." } }

输出数据格式

key：唯一标识符
skeleton_id：场景ID
theme：主题
valence：极性（positive/neutral/negative）
emotion：情绪（anger/sadness/happiness/fear/surprise/disgust）
scenario：场景描述
event：事件描述
gen_text：生成的文本
meta：元数据（模型、参数等）

工作流程

情绪引导文本生成

使用情绪引导的prompt生成文本，支持批量处理和单个数据集处理。

GPT打标

使用GPT-4o-mini对生成的文本进行情绪匹配度打标。

准确率统计

生成按情绪和极性分类的准确率统计。

提取残差激活

提取模型中间层的残差对齐激活值。

研究目标

情绪表达分析：理解LLM如何产生不同情绪的文本
神经回路识别：定位负责情绪表达的模型内部回路
可控生成：通过回路干预实现情绪可控的文本生成

主要结果

SEV数据集

总体准确率：98.85%
最高准确率：Fear（100.00%）
按极性准确率：Positive（99.69%）> Neutral（99.06%）> Negative（97.81%）

TEST_SET数据集

总体准确率：98.96%
最高准确率：Anger（100.00%）
按极性准确率：Positive（99.90%）> Neutral（99.48%）> Negative（97.50%）

依赖环境

Python 3.10
torch
transformers
openai
huggingface_hub

许可证

待定

搜集汇总

数据集介绍

构建方式

在情感计算研究领域，构建可控数据集对探索大语言模型内部情感机制至关重要。SEV数据集采用半自动生成流程，通过GPT-4o-mini在八个日常生活领域构建了480个事件描述。每个记录包含一个中性场景和三种不同情感效价的结果事件，严格禁止使用显性情感词汇，确保情感变化仅源于事件语义而非词汇线索。这种结构设计使得模型在相同语境下产生可比的情感内部状态，为探究情感表征的跨语境一致性提供了纯净的实验基础。

使用方法

该数据集主要应用于大语言模型情感机制的探索性研究。研究人员首先通过提示引导在SEV上激发六种基本情感表达，收集成功生成样本的残差流激活。接着采用组内均值消减技术提取语境无关的情感方向向量，这些向量在深层网络中形成稳定的情感子空间。基于此，研究者可进一步通过神经元贡献度分析和注意力头因果干预，定位情感计算的关键局部组件。最终通过量化各子层对最终情感表征的因果影响，整合形成全局情感回路，实现无需显式指令的精准情感控制。

背景与挑战

背景概述

SEV（Scenario–Event with Valence）数据集由MBZUAI与北京大学联合团队于2025年创建，旨在探索大语言模型情感表达的内部机制。该数据集围绕六种基本情绪构建，通过设计共享叙事场景与不同情感效价的事件组合，为情感计算研究提供了语义内容可控的实验基准。其创新性在于将情感诱发与语义解耦，为揭示大语言模型中情感回路的形成机制奠定了数据基础，推动了可解释人工智能在情感计算领域的发展。

当前挑战

该数据集需解决情感计算领域两大核心挑战：一是如何在大语言模型中分离情感表达与语义内容，避免词汇层面情感线索的干扰；二是在构建过程中需平衡场景的通用性与情感特异性，确保事件描述在保持日常语言自然度的同时精准诱发目标情绪。技术实现上需通过半自动生成流程严格控制情感词汇，并建立独立测试集以验证情感机制的泛化能力，防止数据偏差对电路发现的干扰。

常用场景

经典使用场景

在自然语言处理领域，SEV数据集作为情感计算研究的重要工具，其经典应用场景聚焦于探索大语言模型内部情感表达机制。该数据集通过构建共享叙事背景下的六种基本情感变体，为研究者提供了在匹配语义条件下比较不同情感内部状态的标准化测试平台。其精心设计的场景-事件结构使得模型能够在相同语境中生成不同情感倾向的文本，为情感方向提取和因果干预分析奠定了数据基础。

解决学术问题

SEV数据集有效解决了情感计算领域的关键学术问题，包括大语言模型是否存在语境无关的情感表达机制、这些机制的具体表现形式，以及如何实现通用情感控制。通过提供情感中性且语义匹配的测试样本，该数据集使研究者能够分离情感表达与语义内容，揭示模型内部情感表征的稳定模式。其构建方法突破了传统情感数据集依赖显性情感词汇的局限，为探索模型内部情感计算机制提供了可靠的研究基础。

实际应用

在实际应用层面，SEV数据集支撑的情感电路发现技术已展现出广泛的应用前景。基于该数据集开发的情感控制方法能够精确调节生成文本的情感色彩，在智能客服、情感陪伴机器人、个性化内容生成等场景中实现自然的情感表达。其99.65%的情感表达准确率显著超越了传统提示工程和导向向量方法，为构建具有情感智能的人工智能系统提供了技术保障，推动了人机交互体验的实质性提升。

数据集最近研究