BrunoGR/HRECPW-Hispanic_Responses_for_Emotional_Classification_based_on_Plutchik_Wheel
收藏Hugging Face2024-06-14 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/BrunoGR/HRECPW-Hispanic_Responses_for_Emotional_Classification_based_on_Plutchik_Wheel
下载链接
链接失效反馈官方服务:
资源简介:
HRECPW(基于Plutchik情感轮的西班牙语情感分类响应)数据集旨在训练情感分类模型。该数据集允许模型根据Plutchik情感轮识别和分类各种情感类别,特别关注西班牙语。数据集来源于多个社交媒体平台和其他互联网资源,经过预处理以确保隐私,并分为训练集、验证集和测试集。数据集的结构包括训练集(70%)、验证集(20%)和测试集(10%),每个情感类别包含11,000个样本。数据生成过程包括从多个来源收集数据,并使用OpenAI的GPT-3.5模型生成合成数据以平衡数据集。
提供机构:
BrunoGR
原始信息汇总
HRECPW 数据集
描述
HRECPW(基于Plutchik轮的西班牙语情感分类响应)数据集旨在训练情感分类模型。该数据集允许模型识别和分类基于Plutchik轮的各种情感类别,特别关注西班牙语。
数据集结构
HRECPW数据集由三个子集组成:训练集、验证集和测试集。数据在这些子集中的分布如下:
- 训练集: 70%
- 验证集: 20%
- 测试集: 10%
数据集包括11个情感类别,每个类别有11,000个样本。
情感类别
数据集涵盖以下情感类别:
- 喜爱
- 喜悦
- 钦佩
- 愤怒
- 悲伤
- 乐观
- 憎恨
- 惊讶
- 恐惧
- 平静
- 厌恶
数据生成过程
数据从多个来源收集,以创建多样化的情感表达集。主要来源包括:
- TweetEval(Barbieri et al., 2020):提供多样化的数据集,专注于情感分析。
- DailyDialog(Li et al., 2017):包含各种情境下的日常对话,提供非正式对话中情感表达的宝贵示例。
- HappyDB(Asai et al., 2018):包含与日常情境中的幸福和积极情感相关的表达。
- Emotion(Saravia et al., 2018):包含带有六种基本情感(愤怒、恐惧、喜悦、爱、悲伤和惊讶)的英语推文。
- 对72个人的调查:对11种情感的问题的回答,提供了这些情感引发的体验的见解。
此外,使用OpenAI的GPT-3.5模型生成合成数据以平衡数据集。设计提示以引出反映广泛情感情境的西班牙语响应。例如:
“你需要生成与惊讶情感相关的40个文本样本,所有文本为西班牙语,并按以下编号:
-
文本...
-
文本...
以这些示例为参考:
-
“我支持的球队赢得了冠军的消息让我感到惊讶。”
-
“看到我儿时的朋友将成为我们城市的新市长,我感到非常惊讶。”
-
“我无法相信我刚刚目睹的事情。真是令人惊叹。”
-
“我母亲收到一束花时的惊讶表情非常迷人。”
-
“真是不可思议...”



