five

SESYD 合成文档数据库

收藏
超神经2024-09-12 更新2024-12-14 收录
下载链接:
https://hyper.ai/cn/datasets/34280
下载链接
链接失效反馈
官方服务:
资源简介:
SESYD (Systems Evaluation SYnthetic Documents) 是一个合成文档的数据库,它包含了具有基准真实信息的文档图像。这个数据库主要针对文档图像分析领域的两个主要研究问题:(1) 在线绘图图像(如平面图和电路图)中的象征识别和定位;(2) 地理地图中字符的分割和识别。 SESYD 数据库由 11 个集合组成,用于性能评估,包含 284k 图像、 190k 符号和 284k 字符。该数据库为 Mathieu Delalandre 、 Ernest Valveny 、 Tony Pridmore 和 Dimosthenis Karatzas 发布的,相关论文成果为「Generation of Synthetic Documents for Performance Evaluation of Symbol Recognition & Spotting Systems」,自 2010 年发布以来,已成为文档图像分析领域的关键数据库,并在研究论文中被引用了数百次。

SESYD (Systems Evaluation SYnthetic Documents) is a database of synthetic documents that contains document images paired with ground truth annotations. This database primarily targets two core research issues in the field of document image analysis: (1) Symbol recognition and localization in online line drawings such as floor plans and circuit diagrams; (2) Character segmentation and recognition in geographic maps. The SESYD database consists of 11 collections for performance evaluation, encompassing 284k images, 190k symbols, and 284k characters. Released in 2010 by Mathieu Delalandre, Ernest Valveny, Tony Pridmore, and Dimosthenis Karatzas alongside their research paper titled "Generation of Synthetic Documents for Performance Evaluation of Symbol Recognition & Spotting Systems", SESYD has become a pivotal database in the document image analysis field, and has been cited hundreds of times in academic publications.
创建时间:
2024-09-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
SESYD合成文档数据库是一个包含基准真实信息的合成文档图像数据库,主要应用于文档图像分析领域,专注于在线绘图图像中的象征识别与定位,以及地理地图中的字符分割与识别。该数据库由11个集合构成,涵盖284k图像、190k符号和284k字符,自2010年发布以来已成为该研究领域的关键资源并被广泛引用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务