philschmid/emotion
收藏Hugging Face2023-01-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/philschmid/emotion
下载链接
链接失效反馈官方服务:
资源简介:
Emotion数据集是一个包含英文Twitter消息的数据集,标注了六种基本情绪:愤怒、恐惧、快乐、爱、悲伤和惊讶。数据集分为两种配置:split和unsplit,分别包含20,000和416,809个样本。数据集主要用于文本分类任务,特别是多类分类任务。
提供机构:
philschmid
原始信息汇总
数据集概述
基本信息
- 数据集名称: Emotion
- 标注创建者: 机器生成
- 语言创建者: 机器生成
- 语言: 英语
- 许可证: 其他
- 多语言性: 单语种
- 大小类别: 10K<n<100K
- 源数据集: 原始数据
- 任务类别: 文本分类
- 任务ID: 多类别分类
- PapersWithCode ID: emotion
训练与评估指标
- 配置: default
- 任务: 文本分类
- 任务ID: 多类别分类
- 数据分割:
- 训练集: train
- 评估集: test
- 列映射:
- text: text
- label: target
- 评估指标:
- 准确率 (Accuracy)
- F1 宏平均 (F1 macro)
- F1 微平均 (F1 micro)
- F1 加权平均 (F1 weighted)
- 精确率 宏平均 (Precision macro)
- 精确率 微平均 (Precision micro)
- 精确率 加权平均 (Precision weighted)
- 召回率 宏平均 (Recall macro)
- 召回率 微平均 (Recall micro)
- 召回率 加权平均 (Recall weighted)
数据集结构
-
配置名称: split
- 特征:
- text: 字符串类型
- label: 类别标签,可能值包括 sadness, joy, love, anger, fear, surprise
- 数据分割:
- 训练集: 16000 条数据, 1741597 字节
- 验证集: 2000 条数据, 214703 字节
- 测试集: 2000 条数据, 217181 字节
- 下载大小: 740883 字节
- 数据集大小: 2173481 字节
- 特征:
-
配置名称: unsplit
- 特征:
- text: 字符串类型
- label: 类别标签,可能值包括 sadness, joy, love, anger, fear, surprise
- 数据分割:
- 训练集: 416809 条数据, 45445685 字节
- 下载大小: 15388281 字节
- 数据集大小: 45445685 字节
- 特征:
标签信息
- 标签名称:
- 0: sadness
- 1: joy
- 2: love
- 3: anger
- 4: fear
- 5: surprise
数据实例
json { "text": "im feeling quite sad and sorry for myself but ill snap out of it soon", "label": 0 }



