five

OV

收藏
魔搭社区2025-10-17 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/OV
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: ReadingBank license: - ReadingBank Custom paperUrl: https://arxiv.org/pdf/2108.11591v2.pdf publishDate: "2021" publishUrl: https://github.com/doc-analysis/ReadingBank publisher: - University of California - Microsoft Research Asia tags: - Document Image --- # 数据集介绍 ## 简介 ReadingBank是一个基准数据集,用于对word文档进行弱监督,该数据集包含500K个文档图像,具有广泛的文档类型以及相应的阅读顺序信息。 ## 引文 ``` @article{wang2021layoutreader, title={LayoutReader: Pre-training of Text and Layout for Reading Order Detection}, author={Wang, Zilong and Xu, Yiheng and Cui, Lei and Shang, Jingbo and Wei, Furu}, journal={arXiv preprint arXiv:2108.11591}, year={2021} } ``` ## Download dataset :modelscope-code[]{type="git"}

展示名称:ReadingBank 许可证:ReadingBank 定制许可证 论文链接:https://arxiv.org/pdf/2108.11591v2.pdf 发布日期:"2021" 发布地址:https://github.com/doc-analysis/ReadingBank 发布机构:加利福尼亚大学(University of California)、微软亚洲研究院(Microsoft Research Asia) 标签:文档图像(Document Image) --- # 数据集介绍 ## 简介 ReadingBank是一款面向Word文档弱监督任务的基准数据集,该数据集包含50万份文档图像,涵盖丰富多样的文档类型,并附带对应的阅读顺序标注信息。 ## 引用文献 @article{wang2021layoutreader, title={LayoutReader: Pre-training of Text and Layout for Reading Order Detection}, author={Wang, Zilong and Xu, Yiheng and Cui, Lei and Shang, Jingbo and Wei, Furu}, journal={arXiv preprint arXiv:2108.11591}, year={2021} } ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-08
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作