ma2za/many_emotions
收藏Hugging Face2023-06-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ma2za/many_emotions
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为many_emotions,主要用于文本分类任务,支持多语言,包含来自dair-ai/emotion、daily_dialog和go_emotions等源数据集的数据。数据集规模在10万到100万之间,标签包括愤怒、恐惧、快乐、爱、悲伤、惊讶和中性。数据集结构包括数据实例、数据字段和数据分割。数据字段包括唯一标识符id、文本内容text、分类标签label、继承自源数据集的许可证license、源数据集dataset和文本语言language。数据集创建过程中,原始分割包含重复项,而分割后的数据集中可能存在相同行但不同标签的情况。每行的许可证信息继承自源数据集。
提供机构:
ma2za
原始信息汇总
数据集卡片 for "many_emotions"
数据集描述
数据字段
数据集包含以下字段:
id: 唯一标识符text: 一个字符串特征label: 分类标签,可能的值包括anger(0),fear(1),joy(2),love(3),sadness(4),surprise(5),neutral(6)license: 从源数据集继承的许可证dataset: 源数据集language: 文本语言
数据分割
数据集包含两种配置:
raw: 每种语言有5种配置split: 包含训练、验证和测试配置
数据集创建
策划理由
raw分割包含重复项split分割中可能存在相同行但标签不同的情况
源数据
初始数据收集和规范化
[更多信息需要]
附加信息
许可信息
每行数据都有其自己的许可证,这些许可证继承自源数据集。



