five

Weni/Zeroshot_Train-20K_bias_tweet-format

收藏
Hugging Face2023-09-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Weni/Zeroshot_Train-20K_bias_tweet-format
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Zeroshot_Train-20K_bias_tweet-format,是一个用于训练零样本模型的数据集,包含20,000条数据,格式为提示格式,专门用于训练带有偏见类别的巴西葡萄牙语文本。数据集被分为三部分:6,000条数据包含类别选项但不包含目标类别(偏见),7,000条数据包含类别选项且目标类别作为选项之一但不正确,7,000条数据包含类别选项且目标类别正确。

该数据集名为Zeroshot_Train-20K_bias_tweet-format,是一个用于训练零样本模型的数据集,包含20,000条数据,格式为提示格式,专门用于训练带有偏见类别的巴西葡萄牙语文本。数据集被分为三部分:6,000条数据包含类别选项但不包含目标类别(偏见),7,000条数据包含类别选项且目标类别作为选项之一但不正确,7,000条数据包含类别选项且目标类别正确。
提供机构:
Weni
原始信息汇总

数据集卡片 "Zeroshot_Train-20K_bias_tweet-format"

数据集概述

该数据集是一个用于Zeroshot模型的训练数据集,包含20,000条数据,采用巴西葡萄牙语,专门用于训练带有bias类别的提示格式。

数据集配置

  • 配置名称: default
  • 数据文件:
    • 分割: train
    • 路径: data/train-*

数据集信息

  • 特征:
    • source_text: 字符串类型
    • target_text: 字符串类型
  • 分割:
    • train:
      • 字节数: 4338493
      • 样本数: 20000
  • 下载大小: 1744022
  • 数据集大小: 4338493

任务类别

  • zero-shot-classification

语言

  • pt

数据集大小类别

  • 10K<n<100K

提示格式

"Classifique o tweet entre classe1, classe2, classe3, classe4, bias

Tweet: frase

Label: other

数据集划分

  • 6,000条数据: 提示包含类别选项,但不包含目标类别(bias)
  • 7,000条数据: 提示包含类别选项和目标类别,但目标类别不正确
  • 7,000条数据: 提示包含类别选项和目标类别,目标类别正确
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作