five

ma2za/many_emotions

收藏
Hugging Face2023-06-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ma2za/many_emotions
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为many_emotions,主要用于文本分类任务,支持多语言,包含来自dair-ai/emotion、daily_dialog和go_emotions等源数据集的数据。数据集规模在10万到100万之间,标签包括愤怒、恐惧、快乐、爱、悲伤、惊讶和中性。数据集结构包括数据实例、数据字段和数据分割。数据字段包括唯一标识符id、文本内容text、分类标签label、继承自源数据集的许可证license、源数据集dataset和文本语言language。数据集创建过程中,原始分割包含重复项,而分割后的数据集中可能存在相同行但不同标签的情况。每行的许可证信息继承自源数据集。
提供机构:
ma2za
原始信息汇总

数据集卡片 for "many_emotions"

数据集描述

数据字段

数据集包含以下字段:

  • id: 唯一标识符
  • text: 一个字符串特征
  • label: 分类标签,可能的值包括 anger (0), fear (1), joy (2), love (3), sadness (4), surprise (5), neutral (6)
  • license: 从源数据集继承的许可证
  • dataset: 源数据集
  • language: 文本语言

数据分割

数据集包含两种配置:

  • raw: 每种语言有5种配置
  • split: 包含训练、验证和测试配置

数据集创建

策划理由

  • raw 分割包含重复项
  • split 分割中可能存在相同行但标签不同的情况

源数据

初始数据收集和规范化

[更多信息需要]

附加信息

许可信息

每行数据都有其自己的许可证,这些许可证继承自源数据集。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作