lhoestq/pdfa_cc_main_2021_31_pdf_untruncated
收藏Hugging Face2023-07-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lhoestq/pdfa_cc_main_2021_31_pdf_untruncated
下载链接
链接失效反馈官方服务:
资源简介:
---
pretty_name: CC-MAIN-2021-31-PDF-UNTRUNCATED corpus
tags:
- ocr
- pdf
---
# Dataset card for the CC-MAIN-2021-31-PDF-UNTRUNCATED corpus
- **Homepage:** [https://pdfa.org/new-large-scale-pdf-corpus-now-publicly-available](https://pdfa.org/new-large-scale-pdf-corpus-now-publicly-available)
提供机构:
lhoestq
原始信息汇总
数据集卡片:CC-MAIN-2021-31-PDF-UNTRUNCATED语料库
- 标签:
- ocr
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



