Weni/Zeroshot_Train-20K_bias_tweet-format
收藏Hugging Face2023-09-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Weni/Zeroshot_Train-20K_bias_tweet-format
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为Zeroshot_Train-20K_bias_tweet-format,是一个用于训练零样本模型的数据集,包含20,000条数据,格式为提示格式,专门用于训练带有偏见类别的巴西葡萄牙语文本。数据集被分为三部分:6,000条数据包含类别选项但不包含目标类别(偏见),7,000条数据包含类别选项且目标类别作为选项之一但不正确,7,000条数据包含类别选项且目标类别正确。
该数据集名为Zeroshot_Train-20K_bias_tweet-format,是一个用于训练零样本模型的数据集,包含20,000条数据,格式为提示格式,专门用于训练带有偏见类别的巴西葡萄牙语文本。数据集被分为三部分:6,000条数据包含类别选项但不包含目标类别(偏见),7,000条数据包含类别选项且目标类别作为选项之一但不正确,7,000条数据包含类别选项且目标类别正确。
提供机构:
Weni
原始信息汇总
数据集卡片 "Zeroshot_Train-20K_bias_tweet-format"
数据集概述
该数据集是一个用于Zeroshot模型的训练数据集,包含20,000条数据,采用巴西葡萄牙语,专门用于训练带有bias类别的提示格式。
数据集配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
数据集信息
- 特征:
- source_text: 字符串类型
- target_text: 字符串类型
- 分割:
- train:
- 字节数: 4338493
- 样本数: 20000
- train:
- 下载大小: 1744022
- 数据集大小: 4338493
任务类别
- zero-shot-classification
语言
- pt
数据集大小类别
- 10K<n<100K
提示格式
"Classifique o tweet entre classe1, classe2, classe3, classe4, bias
Tweet: frase
Label: other
数据集划分
- 6,000条数据: 提示包含类别选项,但不包含目标类别(bias)
- 7,000条数据: 提示包含类别选项和目标类别,但目标类别不正确
- 7,000条数据: 提示包含类别选项和目标类别,目标类别正确



