haohaaorg/shan-news-taifreedom_com
收藏Hugging Face2024-10-01 更新2024-07-13 收录
下载链接:
https://hf-mirror.com/datasets/haohaaorg/shan-news-taifreedom_com
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含日期、链接、标题、内容和类别等字段,所有字段的数据类型均为字符串。数据集包含一个训练集分割,共有8900个样本,文件大小为52031976字节。
The dataset includes features such as date, link, title, content, and categories, all of which are string type. The dataset is divided into a training set, containing 8900 samples, occupying 52031976 bytes. The download size of the dataset is 16205700 bytes, and the actual occupied space is 52031976 bytes. The dataset configuration is default, with training data files located at data/train-* path.
提供机构:
haohaaorg
原始信息汇总
数据集概述
数据集信息
- 特征:
- date: 数据类型为字符串。
- link: 数据类型为字符串。
- title: 数据类型为字符串。
- content: 数据类型为字符串。
- categories: 数据类型为字符串。
数据分割
- train:
- 样本数量: 8900
- 字节数: 52031976
数据集大小
- 下载大小: 16205700 字节
- 数据集大小: 52031976 字节
配置
- default:
- 数据文件:
- split: train
- 路径: data/train-*
- 数据文件:



