five

MaguBN/Training-Validation-Test-ILN

收藏
Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MaguBN/Training-Validation-Test-ILN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含葡萄牙语推文,用于情感分析。数据集特征包括推文ID、推文文本、推文日期、情感标签和查询使用情况。数据集分为训练集、验证集和多个测试集,总大小约为18.6MB。数据集由里斯本大学自然科学学院的学生保存,用于预训练的Roberta模型进行情感分析。

该数据集包含葡萄牙语推文,用于情感分析。数据集特征包括推文ID、推文文本、推文日期、情感标签和查询使用情况。数据集分为训练集、验证集和多个测试集,总大小约为18.6MB。数据集由里斯本大学自然科学学院的学生保存,用于预训练的Roberta模型进行情感分析。
提供机构:
MaguBN
原始信息汇总

数据集概述

数据集特征

  • id: 整数类型 (int64)
  • tweet_text: 字符串类型 (string)
  • tweet_date: 字符串类型 (string)
  • sentiment: 整数类型 (int64)
  • query_used: 字符串类型 (string)

数据集分割

  • Train: 95000个样本,15324413字节
  • Validation: 5000个样本,808825字节
  • TestTema: 5000个样本,1057904字节
  • Test: 5000个样本,684589字节
  • Test3classes: 4999个样本,744334字节

数据集大小

  • 下载大小: 11554103字节
  • 数据集大小: 18620065字节

配置

  • config_name: default
  • data_files:
    • Train: data/Train-*
    • Validation: data/Validation-*
    • TestTema: data/TestTema-*
    • Test: data/Test-*
    • Test3classes: data/Test3classes-*

许可证

  • cc-by-nc-4.0

任务类别

  • 文本分类

语言

  • 葡萄牙语 (pt)

标签

  • Twitter
  • 情感分析
  • 存在偏见
  • 表情符号
  • 网址
  • 表情符号

数据集名称

  • 葡萄牙语推文情感分析数据集

数据集大小分类

  • 100K<n<1M
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作