iknow-lab/wikipedia-en-20230720-random1k
收藏Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/iknow-lab/wikipedia-en-20230720-random1k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含1000个样本,每个样本具有三个特征:curid(字符串类型)、title(字符串类型)和text(字符串类型)。数据集仅包含一个训练集,总大小为2423676.14611664字节,下载大小为827810字节。数据集的配置名为default,数据文件路径为data/train-*。
The dataset contains 1000 samples, each with three features: curid (string type), title (string type), and text (string type). The dataset includes only a training set, with a total size of 2423676.14611664 bytes and a download size of 827810 bytes. The datasets configuration name is default, and the data file path is data/train-*.
提供机构:
iknow-lab
原始信息汇总
数据集概述
数据集信息
- 特征:
- curid: 类型为字符串
- title: 类型为字符串
- text: 类型为字符串
数据分割
- 训练集:
- 名称: train
- 字节数: 2423676.14611664
- 样本数: 1000
数据集大小
- 下载大小: 827810
- 数据集大小: 2423676.14611664
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



