five

BrunoGR/HRECPW-Hispanic_Responses_for_Emotional_Classification_based_on_Plutchik_Wheel

收藏
Hugging Face2024-06-14 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/BrunoGR/HRECPW-Hispanic_Responses_for_Emotional_Classification_based_on_Plutchik_Wheel
下载链接
链接失效反馈
官方服务:
资源简介:
HRECPW(基于Plutchik情感轮的西班牙语情感分类响应)数据集旨在训练情感分类模型。该数据集允许模型根据Plutchik情感轮识别和分类各种情感类别,特别关注西班牙语。数据集来源于多个社交媒体平台和其他互联网资源,经过预处理以确保隐私,并分为训练集、验证集和测试集。数据集的结构包括训练集(70%)、验证集(20%)和测试集(10%),每个情感类别包含11,000个样本。数据生成过程包括从多个来源收集数据,并使用OpenAI的GPT-3.5模型生成合成数据以平衡数据集。
提供机构:
BrunoGR
原始信息汇总

HRECPW 数据集

描述

HRECPW(基于Plutchik轮的西班牙语情感分类响应)数据集旨在训练情感分类模型。该数据集允许模型识别和分类基于Plutchik轮的各种情感类别,特别关注西班牙语。

数据集结构

HRECPW数据集由三个子集组成:训练集、验证集和测试集。数据在这些子集中的分布如下:

  • 训练集: 70%
  • 验证集: 20%
  • 测试集: 10%

数据集包括11个情感类别,每个类别有11,000个样本。

情感类别

数据集涵盖以下情感类别:

  1. 喜爱
  2. 喜悦
  3. 钦佩
  4. 愤怒
  5. 悲伤
  6. 乐观
  7. 憎恨
  8. 惊讶
  9. 恐惧
  10. 平静
  11. 厌恶

数据生成过程

数据从多个来源收集,以创建多样化的情感表达集。主要来源包括:

  • TweetEval(Barbieri et al., 2020):提供多样化的数据集,专注于情感分析。
  • DailyDialog(Li et al., 2017):包含各种情境下的日常对话,提供非正式对话中情感表达的宝贵示例。
  • HappyDB(Asai et al., 2018):包含与日常情境中的幸福和积极情感相关的表达。
  • Emotion(Saravia et al., 2018):包含带有六种基本情感(愤怒、恐惧、喜悦、爱、悲伤和惊讶)的英语推文。
  • 对72个人的调查:对11种情感的问题的回答,提供了这些情感引发的体验的见解。

此外,使用OpenAI的GPT-3.5模型生成合成数据以平衡数据集。设计提示以引出反映广泛情感情境的西班牙语响应。例如:

“你需要生成与惊讶情感相关的40个文本样本,所有文本为西班牙语,并按以下编号:

  1. 文本...

  2. 文本...

以这些示例为参考:

  1. “我支持的球队赢得了冠军的消息让我感到惊讶。”

  2. “看到我儿时的朋友将成为我们城市的新市长,我感到非常惊讶。”

  3. “我无法相信我刚刚目睹的事情。真是令人惊叹。”

  4. “我母亲收到一束花时的惊讶表情非常迷人。”

  5. “真是不可思议...”

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作