pdf2dataset/f691b9efec552fa8b50385a65d88e734
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/pdf2dataset/f691b9efec552fa8b50385a65d88e734
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含文本和来源两个特征,均为字符串类型。数据集分为一个训练集,包含569个样本,总大小为779059字节。数据集的下载大小为384998字节。数据集有一个默认配置,其训练数据文件位于data/train-*路径下。
The dataset includes two main features: text and source, both of which are string types. The dataset is divided into a training set (train) with 569 samples, totaling 779059 bytes. The download size of the dataset is 384998 bytes. Additionally, the dataset has a default configuration (default), with its training data files located at data/train-* path.
提供机构:
pdf2dataset
原始信息汇总
数据集概述
数据集信息
- 特征:
- text: 数据类型为字符串。
- source: 数据类型为字符串。
数据分割
- train:
- 字节数: 779059
- 样本数: 569
数据集大小
- 下载大小: 384998
- 数据集大小: 779059
配置
- 配置名称: default
- 数据文件:
- 分割: train
- 路径: data/train-*
- 数据文件:



