sebdg/go_emotions_sequences
收藏Hugging Face2024-05-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/sebdg/go_emotions_sequences
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如文本、标签、ID、标签文本、超级类别、二元分类、标记和标签ID。数据集分为训练集、验证集和测试集,每个集的大小和示例数量都有详细说明。数据集的下载大小为6304424字节,总大小为132337129字节。
该数据集包含多个特征,如文本、标签、ID、标签文本、超级类别、二元分类、标记和标签ID。数据集分为训练集、验证集和测试集,每个集的大小和示例数量都有详细说明。数据集的下载大小为6304424字节,总大小为132337129字节。
提供机构:
sebdg
原始信息汇总
数据集概述
数据集特征
- text: 文本数据,数据类型为字符串。
- labels: 标签序列,包含以下类别:
- 0: admiration
- 1: amusement
- 2: anger
- 3: annoyance
- 4: approval
- 5: caring
- 6: confusion
- 7: curiosity
- 8: desire
- 9: disappointment
- 10: disapproval
- 11: disgust
- 12: embarrassment
- 13: excitement
- 14: fear
- 15: gratitude
- 16: grief
- 17: joy
- 18: love
- 19: nervousness
- 20: optimism
- 21: pride
- 22: realization
- 23: relief
- 24: remorse
- 25: sadness
- 26: surprise
- 27: neutral
- id: 标识符,数据类型为字符串。
- label_text: 标签文本,数据类型为字符串序列。
- super_category: 超类别,数据类型为字符串序列。
- binary_classification: 二元分类标识,数据类型为字符串。
- tokens: 词元,数据类型为整数序列。
- label_ids: 标签ID,数据类型为长整数序列。
数据集分割
- train: 训练集,包含43410个样本,总大小为105874439字节。
- validation: 验证集,包含5426个样本,总大小为13232402字节。
- test: 测试集,包含5427个样本,总大小为13230288字节。
数据集大小
- 下载大小: 6304424字节。
- 数据集总大小: 132337129字节。
数据文件配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为



