rbnuria/SentiMP-Gr
收藏Hugging Face2024-02-01 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/rbnuria/SentiMP-Gr
下载链接
链接失效反馈官方服务:
资源简介:
SentiMP-Gr数据集是一个希腊语的情感分析数据集,基于2021年英国议会议员发布的推文。该数据集由格拉纳达大学的DaSCI研究组、哈恩大学的SINAI研究组以及卡迪夫大学的Cardiff NLP研究组合作开发。数据集包含500条希腊语推文,每条推文提供了推文内容、交叉验证的分区、多个注释者的标签、多数投票结果、平局处理以及最终标签等信息。
SentiMP-Gr数据集是一个希腊语的情感分析数据集,基于2021年英国议会议员发布的推文。该数据集由格拉纳达大学的DaSCI研究组、哈恩大学的SINAI研究组以及卡迪夫大学的Cardiff NLP研究组合作开发。数据集包含500条希腊语推文,每条推文提供了推文内容、交叉验证的分区、多个注释者的标签、多数投票结果、平局处理以及最终标签等信息。
提供机构:
rbnuria
原始信息汇总
SentiMP-Gr Dataset
数据集概述
SentiMP-Gr Dataset 是一个基于2021年英国议员发布的推文的希腊语情感分析数据集。该数据集由以下研究团队共同开发:
- Andalusian Research Institute in Data Science and Computational Intelligence (DaSCI) 研究组,来自 University of Granada
- SINAI 研究组,来自 University of Jaén
- Cardiff NLP 研究组,来自 University of Cardiff
数据集详情
该数据集包含500条希腊语推文,每条推文提供以下信息:
- full_text: 推文内容。
- fold: 用于5折交叉验证的建议分区 {0,1,2,3,4}。
- label_i: 标注者i的标签 (i ∈ {1,2,3}),取值范围为 {-1,0,1}。
- majority_vote: 通过多数投票策略对标注者部分标签进行处理后的结果。当出现平局时,使用标签 "TIE"。取值范围为 {-1,0,1,TIE}。
- tie_break: 用于打破平局的列,仅在 majority_vote 列中出现 "TIE" 时填写。取值范围为 {-1,0,1}。
- gold_label: 最终标签,结合了 majority_vote 和 tie_break 列。取值范围为 {-1,0,1}。
引用
如果您使用此数据集,请引用相关文献。
联系
Nuria Rodríguez Barroso - rbnuria@ugr.es
致谢
本工作部分由西班牙政府资助的以下项目支持:PID2020-119478GB-I00, PID2020-116118GA-I00 和 TED2021-130145B-I00。



