five

lhoestq/pdfa_cc_main_2021_31_pdf_untruncated

收藏
Hugging Face2023-07-24 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lhoestq/pdfa_cc_main_2021_31_pdf_untruncated
下载链接
链接失效反馈
官方服务:
资源简介:
--- pretty_name: CC-MAIN-2021-31-PDF-UNTRUNCATED corpus tags: - ocr - pdf --- # Dataset card for the CC-MAIN-2021-31-PDF-UNTRUNCATED corpus - **Homepage:** [https://pdfa.org/new-large-scale-pdf-corpus-now-publicly-available](https://pdfa.org/new-large-scale-pdf-corpus-now-publicly-available)
提供机构:
lhoestq
原始信息汇总

数据集卡片:CC-MAIN-2021-31-PDF-UNTRUNCATED语料库

  • 标签:
    • ocr
    • pdf
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作