OV
收藏魔搭社区2025-10-17 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/OV
下载链接
链接失效反馈官方服务:
资源简介:
displayName: ReadingBank
license:
- ReadingBank Custom
paperUrl: https://arxiv.org/pdf/2108.11591v2.pdf
publishDate: "2021"
publishUrl: https://github.com/doc-analysis/ReadingBank
publisher:
- University of California
- Microsoft Research Asia
tags:
- Document Image
---
# 数据集介绍
## 简介
ReadingBank是一个基准数据集,用于对word文档进行弱监督,该数据集包含500K个文档图像,具有广泛的文档类型以及相应的阅读顺序信息。
## 引文
```
@article{wang2021layoutreader,
title={LayoutReader: Pre-training of Text and Layout for Reading Order Detection},
author={Wang, Zilong and Xu, Yiheng and Cui, Lei and Shang, Jingbo and Wei, Furu},
journal={arXiv preprint arXiv:2108.11591},
year={2021}
}
```
## Download dataset
:modelscope-code[]{type="git"}
展示名称:ReadingBank
许可证:ReadingBank 定制许可证
论文链接:https://arxiv.org/pdf/2108.11591v2.pdf
发布日期:"2021"
发布地址:https://github.com/doc-analysis/ReadingBank
发布机构:加利福尼亚大学(University of California)、微软亚洲研究院(Microsoft Research Asia)
标签:文档图像(Document Image)
---
# 数据集介绍
## 简介
ReadingBank是一款面向Word文档弱监督任务的基准数据集,该数据集包含50万份文档图像,涵盖丰富多样的文档类型,并附带对应的阅读顺序标注信息。
## 引用文献
@article{wang2021layoutreader,
title={LayoutReader: Pre-training of Text and Layout for Reading Order Detection},
author={Wang, Zilong and Xu, Yiheng and Cui, Lei and Shang, Jingbo and Wei, Furu},
journal={arXiv preprint arXiv:2108.11591},
year={2021}
}
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-08



