five

ruanchaves/reli-sa

收藏
Hugging Face2023-04-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/reli-sa
下载链接
链接失效反馈
官方服务:
资源简介:
ReLi-SA数据集由Cláudia Freitas在PUC-Rio的“基于主动学习的语义标注器”项目框架下创建,包含1600条巴西葡萄牙语的书籍评论,每条评论都手动标注了情感极性。数据集适用于情感分析任务,支持将句子分类为正面、负面、中性或混合情感。数据集包含七位作者的书籍评论,评论语言从高度非正式到正式不等。数据集结构包括源文件、书籍名称、评论ID、句子ID、句子内容和情感标签等字段,并被分为训练集、验证集和测试集,确保不同作者的作品不会出现在多个分割中。

ReLi-SA数据集由Cláudia Freitas在PUC-Rio的“基于主动学习的语义标注器”项目框架下创建,包含1600条巴西葡萄牙语的书籍评论,每条评论都手动标注了情感极性。数据集适用于情感分析任务,支持将句子分类为正面、负面、中性或混合情感。数据集包含七位作者的书籍评论,评论语言从高度非正式到正式不等。数据集结构包括源文件、书籍名称、评论ID、句子ID、句子内容和情感标签等字段,并被分为训练集、验证集和测试集,确保不同作者的作品不会出现在多个分割中。
提供机构:
ruanchaves
原始信息汇总

数据集概述

数据集名称

ReLi-SA

数据集描述

数据集总结

ReLi-SA是由Cláudia Freitas在PUC-Rio的“基于主动学习的语义标注器”项目中创建的数据集。该数据集包含1,600本图书评论,这些评论被手动标注了关于评论书籍的意见及其极性。评论涵盖了七位作者的书籍,语言从高度非正式到更正式的评论不等。

支持的任务和排行榜

  • sentiment-analysis: 用于训练情感分析模型,该模型能够将句子中表达的情感分类为积极、消极、中性或混合。任务成功的衡量标准是高F1分数。

语言

该数据集使用巴西葡萄牙语。

数据集结构

数据实例

每个数据实例包含以下字段:

  • source: 评论的源文件。
  • title: 指示句子是否为评论标题的布尔值。
  • book: 评论所涉及的书籍。
  • review_id: 源文件中的评论ID。
  • score: 评论给书籍的评分。
  • sentence_id: 句子的连续ID。
  • unique_review_id: 评论的唯一ID。
  • sentence: 被标注情感的句子。
  • label: 情感标签,包括positive, neutral, negative, 或 mixed

数据分割

数据集分为三个部分:

train validation test
Instances 7,875 1,348 3,288

分割确保了关于特定作者的评论不会出现在多个分割中。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作