akonda123/reuters_articles
收藏Hugging Face2024-07-20 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/akonda123/reuters_articles
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本数据,主要特征为title(标题)和body(正文)。数据集被分为训练集、验证集和测试集,分别包含17262、2158和2158个样本。
This dataset contains text data with main features being title and body. The dataset is divided into training, validation, and test sets, containing 17262, 2158, and 2158 samples respectively.
提供机构:
akonda123
原始信息汇总
数据集概述
数据特征
- title: 字符串类型
- body: 字符串类型
数据分割
- train:
- 字节数: 13792576
- 样本数: 17262
- validation:
- 字节数: 1870389
- 样本数: 2158
- test:
- 字节数: 1379190
- 样本数: 2158
数据集大小
- 下载大小: 10073414 字节
- 数据集总大小: 17042155 字节
配置
- config_name: default
- data_files:
- train: data/train-*
- validation: data/validation-*
- test: data/test-*
- data_files:



