five

alexandreteles/autotrain-data-told_br_binary_sm

收藏
Hugging Face2022-12-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alexandreteles/autotrain-data-told_br_binary_sm
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是为项目told_br_binary_sm自动处理的AutoTrain数据集,语言为葡萄牙语,任务类别为文本分类。数据集包含两个字段:text(文本内容)和target(分类标签,类别为0和1)。数据集被分为训练集和验证集,分别包含5599和1401个样本。
提供机构:
alexandreteles
原始信息汇总

数据集概述

数据集基本信息

  • 项目名称: told_br_binary_sm
  • 语言: 葡萄牙语(BCP-47代码:pt)
  • 任务类别: 文本分类

数据集结构

数据实例

数据集中的样本示例如下:

json [ { "text": "@user agora não me dá mais, mas antes, porra", "target": 1 }, { "text": "pires é fodido fds mais um", "target": 1 } ]

数据集字段

数据集包含以下字段:

  • text: 字符串类型
  • target: 分类标签,包含两个类别:0 和 1

数据集分割

数据集被分割为训练集和验证集,分割详情如下:

分割名称 样本数量
训练集 5599
验证集 1401

以上信息为数据集详情页面的README文件内容提炼。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作