ruanchaves/reli-sa
收藏Hugging Face2023-04-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ruanchaves/reli-sa
下载链接
链接失效反馈官方服务:
资源简介:
ReLi-SA数据集由Cláudia Freitas在PUC-Rio的“基于主动学习的语义标注器”项目框架下创建,包含1600条巴西葡萄牙语的书籍评论,每条评论都手动标注了情感极性。数据集适用于情感分析任务,支持将句子分类为正面、负面、中性或混合情感。数据集包含七位作者的书籍评论,评论语言从高度非正式到正式不等。数据集结构包括源文件、书籍名称、评论ID、句子ID、句子内容和情感标签等字段,并被分为训练集、验证集和测试集,确保不同作者的作品不会出现在多个分割中。
ReLi-SA数据集由Cláudia Freitas在PUC-Rio的“基于主动学习的语义标注器”项目框架下创建,包含1600条巴西葡萄牙语的书籍评论,每条评论都手动标注了情感极性。数据集适用于情感分析任务,支持将句子分类为正面、负面、中性或混合情感。数据集包含七位作者的书籍评论,评论语言从高度非正式到正式不等。数据集结构包括源文件、书籍名称、评论ID、句子ID、句子内容和情感标签等字段,并被分为训练集、验证集和测试集,确保不同作者的作品不会出现在多个分割中。
提供机构:
ruanchaves
原始信息汇总
数据集概述
数据集名称
ReLi-SA
数据集描述
数据集总结
ReLi-SA是由Cláudia Freitas在PUC-Rio的“基于主动学习的语义标注器”项目中创建的数据集。该数据集包含1,600本图书评论,这些评论被手动标注了关于评论书籍的意见及其极性。评论涵盖了七位作者的书籍,语言从高度非正式到更正式的评论不等。
支持的任务和排行榜
sentiment-analysis: 用于训练情感分析模型,该模型能够将句子中表达的情感分类为积极、消极、中性或混合。任务成功的衡量标准是高F1分数。
语言
该数据集使用巴西葡萄牙语。
数据集结构
数据实例
每个数据实例包含以下字段:
source: 评论的源文件。title: 指示句子是否为评论标题的布尔值。book: 评论所涉及的书籍。review_id: 源文件中的评论ID。score: 评论给书籍的评分。sentence_id: 句子的连续ID。unique_review_id: 评论的唯一ID。sentence: 被标注情感的句子。label: 情感标签,包括positive,neutral,negative, 或mixed。
数据分割
数据集分为三个部分:
| train | validation | test | |
|---|---|---|---|
| Instances | 7,875 | 1,348 | 3,288 |
分割确保了关于特定作者的评论不会出现在多个分割中。



