MaguBN/Training-Validation-Test-ILN
收藏Hugging Face2024-06-05 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/MaguBN/Training-Validation-Test-ILN
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含葡萄牙语推文,用于情感分析。数据集特征包括推文ID、推文文本、推文日期、情感标签和查询使用情况。数据集分为训练集、验证集和多个测试集,总大小约为18.6MB。数据集由里斯本大学自然科学学院的学生保存,用于预训练的Roberta模型进行情感分析。
该数据集包含葡萄牙语推文,用于情感分析。数据集特征包括推文ID、推文文本、推文日期、情感标签和查询使用情况。数据集分为训练集、验证集和多个测试集,总大小约为18.6MB。数据集由里斯本大学自然科学学院的学生保存,用于预训练的Roberta模型进行情感分析。
提供机构:
MaguBN
原始信息汇总
数据集概述
数据集特征
- id: 整数类型 (int64)
- tweet_text: 字符串类型 (string)
- tweet_date: 字符串类型 (string)
- sentiment: 整数类型 (int64)
- query_used: 字符串类型 (string)
数据集分割
- Train: 95000个样本,15324413字节
- Validation: 5000个样本,808825字节
- TestTema: 5000个样本,1057904字节
- Test: 5000个样本,684589字节
- Test3classes: 4999个样本,744334字节
数据集大小
- 下载大小: 11554103字节
- 数据集大小: 18620065字节
配置
- config_name: default
- data_files:
- Train: data/Train-*
- Validation: data/Validation-*
- TestTema: data/TestTema-*
- Test: data/Test-*
- Test3classes: data/Test3classes-*
许可证
- cc-by-nc-4.0
任务类别
- 文本分类
语言
- 葡萄牙语 (pt)
标签
- 情感分析
- 存在偏见
- 表情符号
- 网址
- 表情符号
数据集名称
- 葡萄牙语推文情感分析数据集
数据集大小分类
- 100K<n<1M



