tomaszki/classification_100k
收藏Hugging Face2024-02-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tomaszki/classification_100k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个英文数据集,包含文本、文本标签和标签三个特征。文本和文本标签的数据类型为字符串,标签的数据类型为整数。数据集仅包含训练集,共有100,000个样本。
该数据集是一个英文数据集,包含文本、文本标签和标签三个特征。文本和文本标签的数据类型为字符串,标签的数据类型为整数。数据集仅包含训练集,共有100,000个样本。
提供机构:
tomaszki
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为字符串(string)
- text_label: 数据类型为字符串(string)
- label: 数据类型为整数(int64)
数据分割
- 训练集(train):
- 字节数: 92835478
- 样本数: 100000
数据集大小
- 下载大小: 61482556
- 数据集大小: 92835478
配置
- 默认配置(default):
- 数据文件路径:
data/train-*
- 数据文件路径:



