alexandreteles/autotrain-data-told_br_binary_sm
收藏Hugging Face2022-12-15 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/alexandreteles/autotrain-data-told_br_binary_sm
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目told_br_binary_sm自动处理的AutoTrain数据集,语言为葡萄牙语,任务类别为文本分类。数据集包含两个字段:text(文本内容)和target(分类标签,类别为0和1)。数据集被分为训练集和验证集,分别包含5599和1401个样本。
提供机构:
alexandreteles
原始信息汇总
数据集概述
数据集基本信息
- 项目名称: told_br_binary_sm
- 语言: 葡萄牙语(BCP-47代码:pt)
- 任务类别: 文本分类
数据集结构
数据实例
数据集中的样本示例如下:
json [ { "text": "@user agora não me dá mais, mas antes, porra", "target": 1 }, { "text": "pires é fodido fds mais um", "target": 1 } ]
数据集字段
数据集包含以下字段:
- text: 字符串类型
- target: 分类标签,包含两个类别:0 和 1
数据集分割
数据集被分割为训练集和验证集,分割详情如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 5599 |
| 验证集 | 1401 |
以上信息为数据集详情页面的README文件内容提炼。



