GoEmotions
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/GoEmotions
下载链接
链接失效反馈官方服务:
资源简介:
GoEmotions 是从 Reddit 中提取的 58k 条精心策划的评论的语料库,其中包含对 27 个情感类别或中性的人工注释。示例数:58,009。标签数量:27 + 中性。训练和评估数据集中的最大序列长度:30。在原始数据之上,数据集还包括一个基于 reter-agreement 过滤的版本,其中包含训练/测试/验证拆分:训练数据集的大小:43,410。测试数据集的大小:5,427。验证数据集的大小:5,426。情绪类别是:钦佩,娱乐,愤怒,烦恼,认可,关怀,困惑,好奇,欲望,失望,不赞成,厌恶,尴尬,兴奋,恐惧,感激,悲伤,喜悦,爱,紧张,乐观,自豪,实现、 解脱、 悔恨、 悲伤、 惊喜。
GoEmotions is a curated corpus of 58,009 comments extracted from Reddit, with human annotations for 27 emotion categories or the neutral class. Total number of examples: 58,009. Number of labels: 27 plus neutral. Maximum sequence length in training and evaluation datasets: 30. In addition to the original raw data, the dataset also includes a version filtered based on rater agreement, with predefined train/test/validation splits: Training dataset size: 43,410; Test dataset size: 5,427; Validation dataset size: 5,426. The emotion categories are: admiration, amusement, anger, annoyance, approval, caring, confusion, curiosity, desire, disappointment, disapproval, disgust, embarrassment, excitement, fear, gratitude, grief, joy, love, nervousness, optimism, pride, realization, relief, remorse, sadness, surprise.
提供机构:
OpenDataLab
创建时间:
2022-05-23
搜集汇总
数据集介绍

背景与挑战
背景概述
GoEmotions是一个用于细粒度情感分析的数据集,包含从Reddit提取的58,009条评论,人工标注了27个情感类别或中性标签,覆盖广泛的情感维度。数据集提供了原始版本和基于reter-agreement过滤的版本,后者包含训练、测试和验证拆分,适用于自然语言处理任务如文本分类和情感分析。
以上内容由遇见数据集搜集并总结生成



