pdf2dataset/33c172117c8886e1e296ab1e230770a3
收藏Hugging Face2024-06-22 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/pdf2dataset/33c172117c8886e1e296ab1e230770a3
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个特征:text和source,数据类型均为字符串。数据集包含一个训练集(train),大小为5389207字节,包含944个样本。数据集的下载大小为2804329字节,数据集总大小为5389207字节。数据文件位于路径data/train-*。
The dataset contains two features: text and source, both of which are of string type. The dataset includes a training set (train) with a size of 5389207 bytes, containing 944 samples. The download size of the dataset is 2804329 bytes, and the total dataset size is 5389207 bytes. The data files are located at the path data/train-*.
提供机构:
pdf2dataset
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为字符串。
- source: 数据类型为字符串。
- 分割:
- train: 包含944个样本,占用5389207字节。
- 下载大小: 2804329字节。
- 数据集大小: 5389207字节。
配置
- 配置名称: default
- 数据文件:
- train: 路径为
data/train-*。
- train: 路径为
- 数据文件:



