five

Taraassss/sentiment_analysis_IT_dataset

收藏
Hugging Face2023-05-31 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Taraassss/sentiment_analysis_IT_dataset
下载链接
链接失效反馈
官方服务:
资源简介:
我们的数据是通过标注意大利语推文收集的,涵盖了广泛的主题。总共有2037条推文被标注了情感标签。更多细节可以在我们的论文中找到。

我们的数据是通过标注意大利语推文收集的,涵盖了广泛的主题。总共有2037条推文被标注了情感标签。更多细节可以在我们的论文中找到。
提供机构:
Taraassss
原始信息汇总

数据集概述:sentiment_analysis-IT-dataset

数据集描述

该数据集包含2037条意大利语推文,这些推文涉及广泛的主题,并已被标注了情感标签。详细信息可参考论文(https://aclanthology.org/2021.wassa-1.8/)。

语言

数据集的语言代码为BCP-47的it。

数据集结构

数据实例

数据集的详细描述和分析见于论文:

  • 标题:Sentiment Classification for the Italian Language
  • 作者:Bianchi, Federico and Nozza, Debora and Hovy, Dirk
  • 出版年份:2021
  • 出版机构:Association for Computational Linguistics

数据集字段

数据集包含以下字段:

  • text: 字符串类型
  • feat_id_noticia: 整数16位类型
  • feat_target: 字符串类型
  • target: 分类标签,包含NEG, NEU, POS三个类别

数据集分割

数据集分为训练集和验证集,分割情况如下:

分割名称 样本数量
train 1096
valid 275
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作