dair-ai/emotion
收藏Hugging Face2024-08-08 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/dair-ai/emotion
下载链接
链接失效反馈官方服务:
资源简介:
Emotion数据集是一个包含英文Twitter消息的数据集,标注了六种基本情感:悲伤、喜悦、爱、愤怒、恐惧和惊讶。该数据集主要用于文本分类任务,特别是多类别情感分类。数据集分为两种配置:split和unsplit,分别包含不同的数据分割方式。split配置包含16,000个训练样本、2,000个验证样本和2,000个测试样本,而unsplit配置包含416,809个训练样本。数据集的创建过程是机器生成的,且数据集的大小在10K到100K之间。
提供机构:
dair-ai
原始信息汇总
数据集概述
名称: Emotion
语言: 英语
许可证: 其他
多语言性: 单语
大小: 10K<n<100K
来源: 原始数据
任务类别: 文本分类
任务ID: 多类分类
论文代码ID: emotion
标签: 情感分类
数据集结构
数据实例
json { "text": "string", "label": { "0": "sadness", "1": "joy", "2": "love", "3": "anger", "4": "fear", "5": "surprise" } }
数据字段
- text: 字符串类型
- label: 分类标签,包括 sadness (0), joy (1), love (2), anger (3), fear (4), surprise (5)
数据分割
- split: 总计20,000条,分为训练集(16,000条)、验证集(2,000条)和测试集(2,000条)
- unsplit: 总计416,809条,仅包含训练集
训练与评估指标
- 任务: 文本分类
- 任务ID: 多类分类
- 训练分割: train
- 评估分割: test
- 列映射:
- text: text
- label: target
- 评估指标:
- 准确率 (Accuracy)
- F1 宏平均 (F1 macro)
- F1 微平均 (F1 micro)
- F1 加权平均 (F1 weighted)
- 精确率 宏平均 (Precision macro)
- 精确率 微平均 (Precision micro)
- 精确率 加权平均 (Precision weighted)
- 召回率 宏平均 (Recall macro)
- 召回率 微平均 (Recall micro)
- 召回率 加权平均 (Recall weighted)



