five

NIST 结构化表单二进制图像参考数据集

收藏
帕依提提2024-03-04 收录
下载链接:
https://www.payititi.com/opendatasets/show-1781.html
下载链接
链接失效反馈
官方服务:
资源简介:
NIST 结构化表格数据库由 5,590 页合成文档的二进制黑白图像组成。 该数据库中的文件是 1988 年 IRS 1040 Package X 中的 12 种不同的税表。 其中包括 1040、2106、2441、4562 和 6251 表以及附表 A、B、C、D、E、F 和东南。其中八个表格包含两个页面或表格面;因此,数据库中有 20 种不同的形状面。 该数据库中的文档图像似乎是由个人准备的真实表格,但这些图像是使用计算机自动导出和合成的。 1、900个模拟报税 2、5,590 张完整的结构化人脸图像 3、5,590 个包含输入字段答案的文本文件 4、20 个输入字段类型和上下文表 该数据集适用于文档处理和自动数据采集研究、开发和评估,可用于: 1、表格识别场隔离; 2、在表单上找到输入字段字符分割: 3、将输入字段值分成字符字符识别: 4、识别特定机器打印的字符 For more information on Special Database 2 please contact: Standard Reference Data Program National Institute of Standards and Technology 100 Bureau Dr., Stop 6410 Gaithersburg, MD 20899-6410 (844) 374-0183 (Toll Free) The scientific contact for this database is: Michael Garris National Institute of Standards and Technology 100 Bureau Drive, Stop 8940 Gaithersburg, MD 20899-8940 mgarris [at] nist.gov
提供机构:
帕依提提
二维码
社区交流群
二维码
科研交流群
商业服务