ranWang/un_pdf_text_data_test
收藏Hugging Face2023-06-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ranWang/un_pdf_text_data_test
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: zh
dtype: string
- name: en
dtype: string
- name: fr
dtype: string
- name: es
dtype: string
- name: ru
dtype: string
- name: record
dtype: string
splits:
- name: randomTest
num_bytes: 614476309
num_examples: 2950
- name: randomTest10000
num_bytes: 2028894008
num_examples: 10053
- name: new_randomTest10000
num_bytes: 1832170599
num_examples: 9228
download_size: 2114681565
dataset_size: 4475540916
---
# Dataset Card for "un_pdf_text_data_test"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
ranWang
原始信息汇总
数据集概述
数据集名称
un_pdf_text_data_test
数据集特征
- zh: 数据类型为字符串
- en: 数据类型为字符串
- fr: 数据类型为字符串
- es: 数据类型为字符串
- ru: 数据类型为字符串
- record: 数据类型为字符串
数据集分割
- randomTest:
- 数据量: 614,476,309 字节
- 示例数: 2,950
- randomTest10000:
- 数据量: 2,028,894,008 字节
- 示例数: 10,053
- new_randomTest10000:
- 数据量: 1,832,170,599 字节
- 示例数: 9,228
数据集大小
- 下载大小: 2,114,681,565 字节
- 数据集总大小: 4,475,540,916 字节



