five

rbnuria/SentiMP-Sp

收藏
Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rbnuria/SentiMP-Sp
下载链接
链接失效反馈
官方服务:
资源简介:
SentiMP-Sp数据集是一个基于2021年西班牙议会成员发布的推文的西班牙语情感分析数据集。该数据集由格拉纳达大学的Andalusian Research Institute in Data Science and Computational Intelligence (DaSCI)研究组、哈恩大学的SINAI研究组以及卡迪夫大学的Cardiff NLP研究组合作开发。数据集包含500条西班牙语推文,每条推文包含以下信息:推文内容、用于5折交叉验证的分区、5位标注者的标签、多数投票结果、用于打破平局的标签以及最终标签。

SentiMP-Sp数据集是一个基于2021年西班牙议会成员发布的推文的西班牙语情感分析数据集。该数据集由格拉纳达大学的Andalusian Research Institute in Data Science and Computational Intelligence (DaSCI)研究组、哈恩大学的SINAI研究组以及卡迪夫大学的Cardiff NLP研究组合作开发。数据集包含500条西班牙语推文,每条推文包含以下信息:推文内容、用于5折交叉验证的分区、5位标注者的标签、多数投票结果、用于打破平局的标签以及最终标签。
提供机构:
rbnuria
原始信息汇总

SentiMP-Sp Dataset

数据集概述

SentiMP-Sp Dataset 是一个西班牙语情感分析数据集,基于2021年西班牙议会议员撰写的推文。该数据集由以下研究团队合作开发:

数据集详情

数据集包含500条西班牙语推文。每条推文提供以下信息:

  • full_text: 推文内容。
  • fold: 建议的5折交叉验证的分区 {0,1,2,3,4}。
  • label_i: 第i个标注者的标签(i在{1,2,3,4,5}),取值为 {-1,0,1}。
  • majority_vote: 通过多数投票策略对标注者部分标签进行投票后的结果。当出现平局时,使用标签 "TIE"。取值为 {-1,0,1,TIE}。
  • tie_break: 用于打破平局的列,仅在 majority_vote 列中出现 "TIE" 时填写。取值为 {-1,0,1}。
  • gold_label: 最终标签,结合了 majority_votetie_break 列。取值为 {-1,0,1}。

引用

如果使用此数据集,请引用相关文献。

联系

Nuria Rodríguez Barroso - rbnuria@ugr.es

致谢

本工作部分由西班牙政府资助的以下项目支持:PID2020-119478GB-I00, PID2020-116118GA-I00 和 TED2021-130145B-I00。

许可证

本工作根据Creative Commons Attribution-ShareAlike 4.0 International License进行许可。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作