BanglaEmotion
收藏Opencsg2024-03-15 更新2024-06-22 收录
下载链接:
https://www.opencsg.com/datasets/OpenDataLab/BanglaEmotion
下载链接
链接失效反馈官方服务:
资源简介:
BanglaEmotion 是一个手动注释的 Bangla Emotion 语料库,它结合了社交媒体文本中细粒度情感表达的多样性。更细粒度的情感标签被认为是悲伤、幸福、厌恶、惊奇、恐惧和愤怒——根据 Paul Ekman (1999),它们是六个基本情感类别。对于这项任务,从用户对两个不同 Facebook 群组(Ekattor TV 和 Airport Magistrates)的评论以及流行博主和活动家 Imran H Sarker 博士的公开帖子中收集了大量原始文本数据。这些评论主要是对当前社会政治问题和孟加拉国经济成功与失败的反应。从上述三个来源共抓取了 32923 条评论。其中,共有 6314 条评论被注释到六个类别中。标注语料的分布如下:sad = 1341 开心 = 1908 厌恶 = 703 惊讶 = 562 恐惧 = 384 生气 = 1416 还从上述数据中提供了一个平衡集,并将数据集分成等比的训练集和测试集. 5:1 的比例用于培训和评估目的。有关数据集及其实验的更多信息可以在我们的论文中找到(相关链接如下)。
创建时间:
2024-03-15



