READ-BAD
收藏arXiv2017-12-11 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/1705.03311v2
下载链接
链接失效反馈官方服务:
资源简介:
READ-BAD数据集由罗斯托克大学和维也纳工业大学联合创建,包含2036页来自不同时间和地点的档案文档图像。该数据集挑战了文本行分割方法,因其包含多样的页面布局和退化情况。创建过程中,从9个不同的欧洲档案馆收集了近2000份文档,并通过DigiTexx进行文本区域和基线的标注。READ-BAD数据集的应用领域主要集中在历史文档的布局分析,旨在解决文本行检测和分割的难题,特别是在处理复杂布局和多种退化情况时。
提供机构:
罗斯托克大学
创建时间:
2017-05-09



