yeeaee/skon
收藏Hugging Face2024-07-08 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/yeeaee/skon
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,包括来源、URL、提取日期、标题、作者和内容,所有特征的数据类型均为字符串。数据集分为训练集和测试集,训练集包含21721个样本,测试集包含9309个样本。数据集的下载大小为50951074字节,总大小为103654009字节。
The dataset includes multiple features such as source, URL, date extracted, title, author, and content, all of which are of string type. The dataset is divided into a training set and a test set, with the training set containing 21,721 samples and the test set containing 9,309 samples. The download size of the dataset is 50,951,074 bytes, and the total size is 103,654,009 bytes.
提供机构:
yeeaee
原始信息汇总
数据集概述
数据集特征
- source: 数据来源,数据类型为字符串。
- url: 数据链接,数据类型为字符串。
- date_extracted: 数据提取日期,数据类型为字符串。
- title: 数据标题,数据类型为字符串。
- author: 数据作者,数据类型为字符串。
- content: 数据内容,数据类型为字符串。
数据集分割
- train: 训练集,包含21721个样本,总大小为72764721字节。
- test: 测试集,包含9309个样本,总大小为30889288字节。
数据集大小
- 下载大小: 50951074字节
- 数据集总大小: 103654009字节
配置信息
- config_name: default
- data_files:
- train: 路径为
data/train-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



