expr-exper-emo

github2022-08-16 更新2024-05-31 收录

下载链接：

https://github.com/nlp-waseda/expr-exper-emo

下载链接

链接失效反馈

官方服务：

资源简介：

构建了一个对话语料库，该语料库被注释为表达和经历的情感。

A conversational corpus annotated with expressed and experienced emotions was constructed.

创建时间：

2021-12-24

原始信息汇总

数据集概述

数据集名称

构建带有表达和体验情绪标注的对话语料库

数据集内容

数据集包含对话文本，其中每个话语的文本被替换为Twitter ID。
每个话语包含以下信息：
- 文本：被替换的Twitter ID。
- 词素列表：话语的词素分解。
- 情绪标注：
  - 表达情绪（强/弱）
  - 体验情绪（强/弱）

示例数据结构

json [ { "utterance": { "text": "Twitter ID", "mrph_list": ["词素1", "词素2", ...] }, "emo": { "expr": { "strong": ["情绪1"], "weak": ["情绪2", "情绪3"] }, "exper": { "strong": ["情绪4"], "weak": ["情绪5", "情绪6"] } } }, ... ]

实验相关

训练代码基于Hugging Face的Transformers库。
使用命令行进行训练和预测。
支持多任务学习，仅限于BERT模型。

引用信息

标题：构建带有表达和体验情绪标注的对话语料库
作者：Ide, Tatsuya 和 Kawahara, Daisuke
出版信息：第60届计算语言学年会学生研究工作坊
出版年份：2022年
出版地点：都柏林，爱尔兰
出版机构：计算语言学协会
摘要：数据集旨在促进对话中的情绪识别研究和情绪感知对话响应生成。

搜集汇总

数据集介绍

构建方式

expr-exper-emo数据集的构建基于从Twitter收集的对话数据，并通过人工标注的方式对每条对话中的情感进行分类。具体而言，每条对话的每个话语都被标注了两种情感：表达情感（expressed emotion）和感受情感（experienced emotion）。表达情感指的是说话者在表达话语时所蕴含的情感，而感受情感则是听者在听到话语后所感受到的情感。数据集的构建过程包括数据收集、情感标注以及统计分析，最终形成了一个包含丰富情感信息的日语对话语料库。

使用方法

expr-exper-emo数据集的使用方法主要包括数据加载、模型训练和情感预测。用户可以通过提供的Python脚本加载数据集，并使用预训练模型进行微调。训练过程中，用户可以通过命令行参数指定训练集、验证集和输出目录。训练完成后，可以使用预测脚本对测试集进行情感预测。此外，数据集还支持多任务学习，用户可以通过特定的脚本训练基于BERT的多任务模型。数据集的详细使用说明和代码示例可在GitHub仓库中找到，便于研究人员快速上手。

背景与挑战

背景概述

expr-exper-emo数据集由Tatsuya Ide和Daisuke Kawahara于2022年构建，旨在为对话系统提供情感识别的支持。该数据集的核心研究问题在于区分对话中表达的情感（expressed emotion）与听者感受到的情感（experienced emotion）。通过从Twitter收集对话数据，并对每一条话语进行双重情感标注，该数据集为情感识别和情感感知的对话生成研究提供了重要资源。其研究成果发表于ACL SRW 2022，推动了对话系统中情感理解与响应生成的研究进展。

当前挑战

expr-exper-emo数据集在构建与应用中面临多重挑战。首先，情感标注的主观性使得标注一致性难以保证，尤其是听者感受到的情感（experienced emotion）具有更高的不确定性。其次，数据集的构建依赖于社交媒体文本，其语言风格多样且非正式，增加了情感识别的复杂性。此外，多任务学习模型的训练需要同时处理表达情感与感受情感的双重任务，这对模型的泛化能力提出了更高要求。这些挑战不仅体现在数据标注的准确性上，也反映在模型训练与评估的难度中。

常用场景

经典使用场景

expr-exper-emo数据集在情感计算领域具有重要应用，特别是在对话系统中情感识别与生成的研究中。该数据集通过标注对话中的表达情感（expressed emotion）和体验情感（experienced emotion），为研究者提供了一个独特的视角，用于分析对话中情感的传递与感知。经典使用场景包括对话系统的情感识别模块开发，以及情感感知对话生成模型的训练与评估。

解决学术问题

该数据集解决了情感计算领域中的两个核心问题：一是如何准确识别对话中的表达情感与体验情感，二是如何通过多任务学习提升情感识别的效果。通过提供丰富的对话数据与情感标注，expr-exper-emo数据集为研究者提供了实验基础，推动了情感识别与对话生成技术的进步，特别是在多语言和多文化背景下的情感分析研究中具有重要意义。

实际应用

expr-exper-emo数据集在实际应用中具有广泛潜力，特别是在智能客服、情感陪伴机器人以及社交媒体情感分析等领域。通过利用该数据集训练的情感识别模型，可以提升智能客服系统对用户情感的理解与响应能力，从而提供更加人性化的服务。此外，该数据集还可用于社交媒体平台的情感监测，帮助企业或政府机构更好地理解公众情绪。

数据集最近研究