five

philschmid/emotion

收藏
Hugging Face2023-01-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/philschmid/emotion
下载链接
链接失效反馈
官方服务:
资源简介:
Emotion数据集是一个包含英文Twitter消息的数据集,标注了六种基本情绪:愤怒、恐惧、快乐、爱、悲伤和惊讶。数据集分为两种配置:split和unsplit,分别包含20,000和416,809个样本。数据集主要用于文本分类任务,特别是多类分类任务。
提供机构:
philschmid
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Emotion
  • 标注创建者: 机器生成
  • 语言创建者: 机器生成
  • 语言: 英语
  • 许可证: 其他
  • 多语言性: 单语种
  • 大小类别: 10K<n<100K
  • 源数据集: 原始数据
  • 任务类别: 文本分类
  • 任务ID: 多类别分类
  • PapersWithCode ID: emotion

训练与评估指标

  • 配置: default
  • 任务: 文本分类
  • 任务ID: 多类别分类
  • 数据分割:
    • 训练集: train
    • 评估集: test
  • 列映射:
    • text: text
    • label: target
  • 评估指标:
    • 准确率 (Accuracy)
    • F1 宏平均 (F1 macro)
    • F1 微平均 (F1 micro)
    • F1 加权平均 (F1 weighted)
    • 精确率 宏平均 (Precision macro)
    • 精确率 微平均 (Precision micro)
    • 精确率 加权平均 (Precision weighted)
    • 召回率 宏平均 (Recall macro)
    • 召回率 微平均 (Recall micro)
    • 召回率 加权平均 (Recall weighted)

数据集结构

  • 配置名称: split

    • 特征:
      • text: 字符串类型
      • label: 类别标签,可能值包括 sadness, joy, love, anger, fear, surprise
    • 数据分割:
      • 训练集: 16000 条数据, 1741597 字节
      • 验证集: 2000 条数据, 214703 字节
      • 测试集: 2000 条数据, 217181 字节
    • 下载大小: 740883 字节
    • 数据集大小: 2173481 字节
  • 配置名称: unsplit

    • 特征:
      • text: 字符串类型
      • label: 类别标签,可能值包括 sadness, joy, love, anger, fear, surprise
    • 数据分割:
      • 训练集: 416809 条数据, 45445685 字节
    • 下载大小: 15388281 字节
    • 数据集大小: 45445685 字节

标签信息

  • 标签名称:
    • 0: sadness
    • 1: joy
    • 2: love
    • 3: anger
    • 4: fear
    • 5: surprise

数据实例

json { "text": "im feeling quite sad and sorry for myself but ill snap out of it soon", "label": 0 }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作